Ученые обучили нейросеть мгновенно оценивать электронные свойства органических полимеров без дорогих суперкомпьютеров

Исследователи из Новосибирского института органической химии СО РАН и НГУ создали нейросеть на архитектуре DimeNet++, которая предсказывает ключевые электрические характеристики сопряженных полимеров по трехмерной структуре исходного мономера. Модель достигает точности на уровне передовых мировых методов (ошибка около 0,07 эВ) и при этом не требует предварительных квантово-химических расчетов. Это позволяет химикам отсеивать заведомо неподходящих кандидатов еще до синтеза, экономя месяцы лабораторной работы. Исследование выполнено при поддержке гранта Российского научного фонда (РНФ) и опубликовано в журнале Polymers.Органические полимеры являются основой современной гибкой электроники: от солнечных батарей и транзисторов до газовых сенсоров и светодиодов. Однако создание нового полимера с нужными свойствами может занимать недели или месяцы синтетической работы, а компьютерное моделирование требует больших вычислительных мощностей и не всегда даёт точный результат. В итоге многие перспективные молекулы так и остаются непроверенными.В связи с этим сибирские ученые, вместо того чтобы «в лоб» моделировать полимер, поступили иначе: они обучили графовую нейронную сеть на массиве уже известных данных — сначала на расчетных (около 54 000 точек), а затем дообучили на реальных экспериментальных измерениях.«Когда мы попробовали обучить нейросеть только на экспериментах, ошибка составляла больше 0,3 эВ, что неприменимо для практического использования. Модель просто запоминала данные, а не понимала химию процесса, – рассказывает участник работы Лев Петросян. – Но если сначала дать сети понять квантовую механику мономеров на расчётных данных, а потом аккуратно дообучить на реальных полимерах, точность резко возрастает».Ключевым открытием стало то, что характер предварительного обучения имеет решающее значение. Если сеть учили на одиночных молекулах (мономерах), улучшение было минимальным (ошибка ~0,29-0,35 эВ). Однако если использовались данные, экстраполированные на бесконечную полимерную цепь, точность скачкообразно возрастала. Итоговая модель достигла точности, сравнимой с лучшими мировыми аналогами: ширина запрещенной зоны — ошибка 0,074 эВ, уровень ВЗМО — ошибка 0,141 эВ, уровень НСМО — ошибка 0,172 эВ.Теперь ученым больше не нужно будет проводить сложные квантовые расчеты или проходить слепой синтетический путь. Достаточно построить трехмерную модель мономера (даже с помощью простого компьютерного силового поля), отдать ее на анализ нейросети и через секунду получить предсказание.Архитектура DimeNet++ была выбрана не случайно. В отличие от классических графовых сетей, она использует направленную передачу сообщений, что позволяет явно учитывать длины связей, валентные и двугранные углы. Анализ внутренних представлений модели показал, что при дообучении сеть не перестраивается заново, а мягко адаптирует знания из области квантовой химии мономеров к миру экспериментальных полимеров.«Наша работа показывает, что грамотно подобранное предобучение на "полимер-релевантных" расчетных данных способно заменить дельта-обучение и устранить главный узкий вычислительный этап — предварительный TD-DFT расчет. Теперь химик-синтетик может буквально за секунду оценить, будет ли предложенный мономер давать нужную запрещенную зону для органического фотоэлемента, прежде чем тратить месяцы на его синтез», — поясняет руководитель проекта, к.х.н. Игорь Павлович Коскин.Разработанный подход открывает новые возможности для ускоренного скрининга и целевого молекулярного дизайна сопряженных полимеров. В перспективе метод может быть распространен и на другие классы полимерных материалов, а также на предсказание более широкого спектра свойств: механическую прочность, температуру стеклования, подвижность зарядов.

Ученые обучили нейросеть мгновенно оценивать электронные свойства органических полимеров без дорогих суперкомпьютеров
© InScience