Тринадцать генетических последовательностей, выделенных от людей с инфекцией COVID-19 в первые дни пандемии в Китае, были таинственным образом удалены из онлайн-базы данных в прошлом году, но теперь восстановлены. Джесси Блум, Вычислительный биолог и специалист по вирусной эволюции из Онкологического исследовательского центра Фреда Хатчинсона в Сиэтле обнаружил, что последовательности были удалены из онлайн-базы данных по просьбе ученых из Ухани, Китай. Но с помощью интернет-расследований он смог восстановить копии данных, хранящихся в Google Cloud. Последовательности принципиально не меняют понимание ученых о происхождении COVID-19, включая сложный вопрос о том, распространяется ли коронавирус естественным путем от животных. людям или сбежавшим в результате лабораторной аварии. Но их удаление усиливает опасения, что секретность со стороны китайского правительства помешала международным усилиям понять, как возник COVID-19. Результаты Блума были опубликованы в препринте, опубликованном во вторник, и еще не прошедшем рецензирование другими учеными. «Я думаю, что это определенно согласуется с попыткой скрыть последовательности», — сказал он BuzzFeed News. Блум узнал об удаленных данных после прочтения статьи группы под руководством Карлоса Фаркаса из Университета Манитобы в Канаде о некоторых из самых ранних генетических последовательности SARS-CoV-2. В статье Фаркаса описаны последовательности, взятые у амбулаторных пациентов больниц в рамках проекта исследователей из Ухани, которые разрабатывали диагностические тесты на вирус. Но когда Блум попытался загрузить последовательности из Sequence Read Archive, онлайн-базы данных, управляемой Национальным институтом здравоохранения США, ему выдали сообщения об ошибках, показывающие, что они были удалены. Блум понял, что копии данных SRA также хранятся на серверах. запущен Google, и смог разгадать URL-адреса, по которым можно найти недостающие последовательности в облаке. Таким образом, он восстановил 13 генетических последовательностей, которые могут помочь ответить на вопросы о том, как развился коронавирус и откуда он взялся. Блум обнаружил, что удаленные последовательности, как и другие, собранные позднее за пределами города, были больше похожи на коронавирусы летучих мышей. быть конечными предками вируса, вызывающего COVID-19, — чем последовательности, связанные с рынком морепродуктов Хуанань в Ухане. Это дополняет предыдущие предположения о том, что рынок морепродуктов мог быть ранней жертвой COVID-19, а не местом, где коронавирус впервые перескочил с животных на людей. «Это очень интересное исследование, проведенное доктором Блумом и Я считаю, что анализ полностью верен », — сказал Фаркас BuzzFeed News по электронной почте. Скотт Готтлиб, бывший глава Управления по санитарному надзору за качеством пищевых продуктов и медикаментов, также похвалил выводы в Twitter. Но на некоторых ученых это произвело меньшее впечатление. «Это действительно ничего не добавляет к спорам о происхождении», — сказал BuzzFeed News по электронной почте Роберт Гарри из Тьюлейнского университета в Новом Орлеане. Гарри утверждал, что рынок Хуанань или другие рынки в Ухане все еще могут быть источником COVID-19. Блум — один из 18 ученых, опубликовавших в мае письмо с критикой исследования ВОЗ и Китая о происхождении SARS-CoV-2. Ученые утверждали, что в отчете ВОЗ и Китая не было «сбалансировано рассмотрение» конкурирующих идей о том, что коронавирус естественным образом распространяется от животных к людям или ускользнул из лаборатории — теория, которую в отчете сочли «крайне маловероятной». После публикации отчета ВОЗ и Китая правительства США и 13 других стран пожаловались на то, что у них «отсутствует доступ к полным, исходным данным и образцам». Удаленные вирусные последовательности были впервые загружены в SRA в начале марта 2020 года, примерно в то время, когда исследователи во главе с Яном Ли и Тянган Лю из Уханьского университета опубликовали препринт с описанием своей работы с использованием генетического секвенирования для диагностики COVID-19. Всего за несколько дней до этого Государственный совет Китая приказал централизованно утверждать все документы, связанные с COVID-19. Затем последовательности были изъяты из SRA в июне, примерно в то время, когда окончательная версия статьи была опубликована в научном журнале. По данным NIH, авторы попросили удалить последовательности. «Запрашивающая сторона указала, что информация о последовательности была обновлена, была отправлена в другую базу данных, и хотела, чтобы данные были удалены из SRA, чтобы избежать проблем с контролем версий», — сообщила BuzzFeed News по электронной почте пресс-секретарь NIH Аманда Файн. Однако неясно, есть ли у этих последовательностей. с тех пор были размещены в Интернете в другой базе данных. «Нет убедительной научной причины для удаления», — написал Блум в своем препринте, утверждая, что последовательности, вероятно, были «удалены, чтобы скрыть их существование». Это предполагает, как он писал, «менее чем искренние усилия по отслеживанию раннего распространения эпидемии». Хотя последовательности были удалены, Гарри отметил, что ключевые генетические мутации, которые они содержали, все еще были опубликованы в таблице в заключительном документе команды Уханя. . «Джесси Блум не обнаружил ничего нового, что еще не является частью научной литературы», — сказал Гарри BuzzFeed News, обвинив Блума в написании своего препринта «подстрекательским, ненаучным и ненужным образом». Блум написал исследователям Ухани, спрашивая их, почему последовательности были удалены, но ответа не было. Ли и Лю также не сразу ответили на запрос BuzzFeed News. Это не первый раз, когда ученые высказывают опасения по поводу удаления данных, которые могут помочь ответить на вопросы о происхождении COVID-19. Основная база данных, содержащая информацию о последовательностях коронавируса, поддерживаемая Уханьским институтом вирусологии, которая является предметом спекуляций о возможной «лабораторной утечке» вируса, была отключена в сентябре 2019 года. Источники пандемии посетили институт в феврале, им сообщили, что база данных, которая, как сообщается, включала данные о 22000 образцах коронавируса и записи последовательностей, была удалена после неоднократных попыток взлома.