Войти в почту

Китайская нейросеть LucaProt нашла 160 тысяч новых вирусов

Исследователи из китайского Университета Сунь Ятсена и компании Alibaba Cloud Intelligence вместе с австралийскими коллегами разработали новый искусственный интеллект, который способен обнаруживать и классифицировать ранее неизвестные вирусы с беспрецедентной точностью и скоростью.

Китайская нейросеть LucaProt нашла 160 тысяч новых вирусов
© Свободная пресса

Называется новая нейросеть LucaProt. Она работает по тем же принципам, что и всем известный ChatGPT. Китайский нейросеть обрабатывает огромные массивы данных о генетических последовательностях, включая длинные вирусные геномы, и извлекает оттуда скрытую информацию, которую ранее было трудно обнаружить традиционными методами.

Профессор Эдвард Холмс из Университета Сиднея сравнивает эти неизвестные вирусы с "тёмной материей" последовательности, поскольку они представляют собой неучтённое ранее разнообразие вирусного мира.

LucaProt использует алгоритмы глубокого обучения для выявления уникальных последовательностей и вторичных структур белка, которые все РНК-вирусы используют для репликации. Этот процесс позволяет инструменту идентифицировать вирусы и систематизировать их гораздо быстрее, чем традиционные компьютеры.

Очень похожий искусственный интеллект, AlphaFold, был разработан исследователями из корпорации Google, и предсказывал химические свойства новых соединений. За это ученые получили Нобелевскую премию по химии.

Анализируя ранее не распознанные данные генетических последовательностей в общедоступных базах данных, нейросеть идентифицировала вирусы на основе их генной последовательности и информации о структуре белка. Причем на то, чтобы принять решение по каждому новому виду, нейросети нужно было не больше 1 секунды.

При такой скорости работы китайской нейросети хватило бы всего 3 месяцев, чтобы полностью описать все многообразие животного мира Земли.

Правда, для работы с более многообразными объектами (например, звездами или планетами), даже такая нейросеть покажется не слишком быстрой. Чтобы описать все звезды в нашей галактике Млечный путь, китайской нейросети при ее скорости понадобилось бы более 10 тысяч лет. Да, при скорости: одна секунда на каждую звезду. Так что китайским разработчикам нейросетей есть, куда двигаться.

Тем не менее, используя LucaProt, китайские исследователи уже обнаружили более 160 тысяч ранее неизвестных вирусов, которые были спрятаны в существующих базах данных последовательностей. Это китайское исследование стало рекордным по количеству одномоментно обнаруженных видов живых существ. Профессор Холмс уверен: удастся выявить еще миллионы никогда прежде не известных науке вирусов.

Свойства десятков тысяч новых вирусов еще предстоит изучить. Но уже сейчас понятно, что среди них есть и огромное количество опасных для человека и животных.

Профессор Манг Ши из Университета Сунь Ятсена подчёркивает, что LucaProt предлагает гораздо более эффективный и чувствительный метод обнаружения вирусов по сравнению с традиционными. Это открывает новые возможности для изучения вирусного разнообразия и разработки стратегий профилактики и борьбы с вирусными инфекциями.

Доктор Чжао-Ронг Ли из Alibaba Cloud Intelligence отмечает, что LucaProt демонстрирует мощь искусственного интеллекта в области биологических исследований. Нейросеть постоянно учится, изучая большие объемы геномных данных известных вирусов. Это помогает машине изучить тонкие различия, определяющие разные виды вирусов. И чем больше данных она обрабатывает, тем лучше и быстрее распознает новые вирусы.

Тем более, что РНК-вирусы очень быстро эволюционируют, поэтому существующие методы идентификации, вероятно, пропускают многие вирусные варианты. Теперь исследовательская группа планирует совершенствовать LucaProt и применять его для обнаружения ещё большего разнообразия неизвестных вирусов. Фактически, китайцы получили в руки настоящую Библию вирусного мира.

Из почти 162 тысяч новых видов РНК-вирусов многие обитали в самых экстремальных средах, включая «черные курильщики» (геотермальные источники на дне океана) или сверхсоленые озера. А это потенциально дает китайским ученым ключи к пониманию того, как возникли вирусы и другие элементарные формы жизни.

Способность быстро выявлять новые вирусы имеет гигантское значение для глобального здравоохранения. Раннее обнаружение вспышек вирусных заболеваний может помочь правительствам и организациям более эффективно реагировать на угрозы. То есть каждую новую инфекцию можно идентифицировать до того, как она перерастет в пандемии. Вот если бы у китайцев был их LucaProt в 2019 году, когда в Ухане началась пандемия, возможно, коронавирус оказался бы для человечества не страшен.