Биологи обучают ИИ создавать лекарства и вакцины
Ученые разработали программное обеспечение для искусственного интеллекта, создающее белки, которые могут быть полезны в качестве вакцин, средств лечения рака или даже инструментов для удаления углеродного загрязнения из воздуха. Работа опубликована в журнале Science.
Это исследование было проведено Медицинской школой Вашингтонского университета и Гарвардским университетом.
“Белки, которые мы находим в природе, — это удивительные молекулы, но разработанные белки могут сделать гораздо больше. В этой работе мы показываем, что машинное обучение можно использовать для разработки белков с широким спектром функций”, — сказал старший автор Дэвид Бейкер, исследователь HHMI и профессор биохимии в UW Medicine.
На протяжении десятилетий ученые использовали компьютеры для создания белков. Некоторые белки, такие как антитела и синтетические связывающие белки, были адаптированы в лекарства для борьбы с COVID-19. Другие, такие как ферменты, помогают в промышленном производстве. Но одна белковая молекула часто содержит тысячи связанных атомов; даже со специализированным научным программным обеспечением их трудно изучить и спроектировать.
Вдохновленная тем, как алгоритмы машинного обучения могут генерировать истории или даже изображения из подсказок, команда решила создать аналогичное программное обеспечение для разработки новых белков.
Ученые обучили несколько нейронных сетей, используя информацию из Банка данных белка, который является общедоступным хранилищем сотен тысяч белковых структур из всех царств жизни. Полученные в результате нейронные сети удивили даже специалистов, которые их создали.
Команда разработала два подхода к конструированию белков с новыми функциями. Первый, получивший название “галлюцинация”, сродни DALL-E или другим генеративным инструментам ИИ, которые выдают новые результаты на основе простых подсказок. Вторая, получившая название “inpainting”, аналогична функции автозаполнения, используемой в современных поисковых системах и почтовых клиентах.
И книги, и белки можно понимать как длинные последовательности букв. В случае с белками каждая буква соответствует химическому строительному блоку, называемому аминокислотой. Начиная со случайной цепочки аминокислот, программное обеспечение изменяет последовательность снова и снова, пока не будет сгенерирована конечная последовательность, которая кодирует желаемую функцию. Эти конечные аминокислотные последовательности кодируют белки, которые затем могут быть изготовлены и изучены в лаборатории.
Команда также показала, что нейронные сети могут заполнить недостающие фрагменты структуры белка всего за несколько секунд. Такое программное обеспечение может помочь в разработке новых лекарств.