«Биоинформатика — это не просто "поставьте компьютер и считайте"»

17 июня 2020, 18:48

Кандидат биологических наук, сотрудник факультета биоинженерии и биоинформатики МГУ им. М. В. Ломоносова и Института биоорганической химии РАН Артур Залевский в интервью рассказал Indicator.Ru о «синусоидах» в карьере биолога, о проклятии «тыжбиоинформатика» и о невзятых рубежах научпопа в России. — Биоинформатика — междисциплинарная область, которая требует разбираться и в программировании, и в биологии. Кто и как в нее приходит, и каким был ваш опыт? — Я попал в биоинформатику совершенно случайно. В школе мне хотелось заниматься созданием каких-нибудь киборгов, вживляемых имплантов, например, чипов, которые можно будет один раз вставить в голову и уже не запоминать правила русского языка, а сразу писать без ошибок. Конечно, к этому меня подталкивала любимая научная фантастика. И в какой-то момент я узнал, что в МГУ есть факультет биоинженерии и биоинформатики. Советоваться на эту тему мне было не с кем, и я решил, что буду учиться там. Но когда я поступил, выяснилось, что в реальности биоинженерия сегодня — это в основном генетические манипуляции в лучшем случае на уровне достаточно простых организмов, таких, как кишечная палочка или дрожжи. Я был, конечно, немного разочарован: шел в одно место, оказался в другом. Но мне в целом здесь понравилось. В России под биоинформатикой понимают достаточно узкую область, связанную в первую очередь с обработкой геномных данных, и изучение структур биологических молекул. Но в мире к ней относят и огромное количество других областей, связанных с обработкой любых биологических данных с использованием информационных технологий. Потому в биоинформатику сегодня приходят физики, математики, химики, люди из смежных областей биологи, программисты в широком смысле слова. При этом профессиональные знания именно в области биологии для биоинформатики очень важны: если вы не понимаете, какую биологическую задачу решаете, какие данные и почему анализируете, то на выходе получите бессмысленный мусор. — Но ведь среди биоинформатиков существует разделение, когда одни больше занимаются созданием методов анализа данных, а другие применяют эти разработки к излюбленной биологической проблеме? — Безусловно. На любой конференции доклад может вас зацепить либо биологической проблемой, изучение которой вам интересно, например, старение; либо биологическим объектом, с которым вы тоже работаете, допустим, мыши или нематоды C. elegans; либо по методам, при помощи которых этот объект и проблема изучаются. И разные группы действуют по-разному. Одни смогли поставить свою уникальную биологическую модель, лучше всех научились разводить каких-то животных, и всевозможные методы «натравливают» на них. Например, у нас на факультете есть колония голых землекопов. А есть группы вроде нас, скорее с методологическими компетенциями. Мы умеем моделировать биологические молекулы при помощи разного набора методов на масштабах от химических реакций до сборки наноконтейнеров при помощи технологий ДНК-оригами. И к нам приходят люди с совершенно разными биологическими объектами и задачами, которым нужен конкретный метод. Но часто в одной и той же группе совмещаются оба направления. То есть у вас есть некая магистральная тема или задача, а вокруг нее вы нарабатываете методы. — А что вело вашу работу с момента, как вы вступили в эту научную область — разработка методов или интерес к одной биологической проблеме? — Сложный для меня вопрос. Моя «детская травма», студенческая и диссертационная, связана с тромбином. Это ключевой белок в каскаде свертывания крови, в принципе, один из самых изученных белков в мире. Но на удивление, с ним до сих пор связано несколько загадок. Я занимаюсь одной из таких проблем: почему-то тромбин по-разному ведет себя в зависимости от присутствия иона натрия. Казалось бы, натрий всегда есть в нашей крови, но все равно поведение тромбина меняется. Уже лет десять я бьюсь над этим. Мы применяли к тромбину самые разные методы, в том числе свои новые технологии. Например, разработали пайплайн для моделирования химических реакций; в нем используются, конечно, и инструменты других групп, но мы их скомпоновали со своими и теперь применяем этот же пайплайн к другим объектам. Например, к ферментам, которые должны препятствовать отравлению боевыми химическими отравляющими веществами. Тромбин я на какое-то время бросал, занимался другими задачами, потому что уже невозможно работать с ним, когда так долго не получается результат. Мне удалось разработать метод, который позволяет нам изучать взаимодействие комбинаторных пептидных библиотек (пептиды — это короткие белки, состоящие из трех-четырех аминокислот) с разными биологическими молекулами. И оказалось, что этот метод я могу снова применить к тромбину, получить новые знания, новые гипотезы, которые, судя по всему, оправдываются. Мне кажется, многие движутся по такой же синусоиде: у вас есть объект, вокруг которого вы бьетесь, рано или поздно вы отвлекаетесь от него, работаете над новыми идеями, создаете новые методы и возвращаетесь к нему с ними — а вдруг он сдастся на этот раз? — Возвращаясь к биоинформатике как области: встречается мнение, что в России она развивается неплохо в том числе потому, что на нее не требуется столько средств, как на содержание экспериментальных животных и остальные составляющие мокрых лабораторий. Верно ли это, или биоинформатика тоже достаточно дорогая область? — Могу ошибиться в цитате, но кажется, однажды Михаил Гельфанд и Константин Северинов даже призывали (наполовину в шутку, конечно) отказаться от финансирования мокрой науки в Российской Федерации — с учетом того, сколько к нам идут реагенты, проще все деньги вложить в биоинформатику и стать лидерами в ней. Сложно комментировать это, потому что я не знаю точной стоимости мокрых лабораторий. В целом, конечно, компьютеры дешевле. Но есть обратная сторона, которую, к сожалению, многие выступающие с позиций «дешевой биоинформатики» не учитывают. Биоинформатика — это не просто «поставьте компьютер и считайте». Построить нормальный вычислительный кластер, инфраструктуру, пригодную для биоинформатики — отдельная сложная задача. И его поддержка тоже стоит денег: это и ремонт, и оплата сотрудников, причем такие специалисты стоят дороже, чем в обычной техподдержке. И иногда компьютеры внезапно ломаются, большие компьютеры ломаются сильно, могут простаивать неделями и месяцами. В это время простаивает вся группа ученых, но им нужно по-прежнему платить. А чтобы работа останавливалась меньше, нужно больше денег вкладывать в резервирование, в квалифицированных специалистов… Как правило, в рассуждениях о «дешевой биоинформатике» люди не учитывают реальную стоимость вычислительной инфраструктуры, на которой можно делать исследования мирового уровня. Но самое важное даже не это. Биоинформатики, как ни крутите, должны оперировать какими-то данными. Конечно, сегодня есть открытые базы биологических данных, но на них уже «пасутся» люди со всего мира, включая огромное количество биоинформатиков из Индии и Китая. Потому только на собственных данных можно сделать качественную науку, которая пойдет в топовые журналы. А чтобы их получить, нужны или хорошо настроенные коллаборации за рубежом, либо собственные экспериментальные лаборатории. — А как у вас построен процесс получения собственных данных? С кем из экспериментаторов вы сотрудничаете? — Расскажу о нашей группе вычислительной биологии факультета биоинженерии и биоинформатики. У нас максимально тесная коллаборация с несколькими лабораториями в Институте биоорганической химии академиков Шемякина и Овчинникова РАН, в частности, с группами Ивана Смирнова и Александра Габибовича Габибова. С ними мы разрабатываем антидоты к химическому оружию, изучаем механизмы антибиотикоустойчивости и ее преодоления. У них огромные компетенции по высокопроизводительным мокрым методам, что позволяет накапливать большое количество данных. Вместе мы публикуем высококлассные статьи, а в перспективе, надеюсь, получатся и реальные продукты для фармрынка. Плюс у нас есть коллаборации с Сеченовским университетом, в частности с Институтом молекулярной медицины. Там мы тоже моделируем для коллег молекулы, а они проверяют их экспериментально. И, конечно же, у нас много коллабораций внутри МГУ. Например, я участвую в проектах группы Марины Борисовны Готтих, которая занимается изучением вируса иммунодефицита человека. Для успешного встраивания в геном вирус использует некоторые наши собственные клеточные механизмы и сейчас мы работаем над тем, как ему можно в этом помешать. И еще у нас есть ряд прикладных проектов. Например, для одного небольшого фармстартапа мы тоже придумываем молекулы, которые, в идеале, помогут бороться с тревожностью и депрессией. Так что нам повезло сформировать свою сеть контактов с сильными группами внутри России, а через них у нас есть связи с более крупными международными коллаборациями. Например, один наш давний коллега работает в Университете Экс-Марсель, и с ним мы делаем несколько проектов по изучению взаимодействия цинка с различными белками и агрегатами, что важно и при некоторых нейродегенеративных заболеваниях. — Быстро ли эволюционирует биоинформатика? Вы назвали очень много тем и направлений. Характерно ли для вашей области усиление специализации ученых? — Я действительно участвую в очень разных проектах, например, однажды на летней практике на Беломорской биологической станции МГУ мы со студентами открыли новый вид арктической медузы. В авторах статьи об этом — все студенты, которые участвовали в этой группе. Есть проекты, связанные с изучением лекарств, есть проекты по изучению метаболических сетей, в которых разные вещества внутри нашего организма синтезируются и исчезают. Я этим занимаюсь ровно потому, что мне безумно интересно разобраться, как там все работает. И это, конечно, действует против меня. Если бы я концентрировался на одних задачах, я бы, наверное, гораздо раньше их закончил, достиг успеха и более продуктивно двигался бы к следующим. Практика показывает, что, если вы не распыляетесь, вы скорее будете достигать каких-то высот, получать новые биологические знания. Но все равно многие мои знакомые биоинформатики — мастера на все руки. Мне кажется, причина в том, что нас просто очень мало. Несмотря на то, что сейчас со всех сторон, казалось бы, говорят про биоинформатику, даже «Роснефть» этим занимается, специалистов все равно не хватает. И меня и моих коллег готовы приглашать куда угодно: «Посчитайте нам это, посчитайте то, вы же можете, вы же биоинформатики». И неважно, что вы занимаетесь совершенно другой областью. «Тыжбиоинформатик» — такая же формула, как «тыжпрограммист, поэтому почини мой принтер». Я надеюсь, что с помощью в том числе нашего факультета, наших выпускников, такого отвлечения будет все меньше. — Как на вашу научную работу повлияла пандемия? — На меня лично — максимально катастрофически. Опять же из логики «тыжпрограммист» в марте на меня возложили обязанности заместителя декана по дистанционному обучению нашего факультета. Мы быстро развернули онлайн-платформу, на которой проходят занятия, и дополнительные сервисы, осуществляем поддержку преподавателей и студентов, стараемся максимально сгладить этот процесс и обеспечить их всем необходимым. Конечно, это отнимает много времени, и я сейчас фактически по науке не успеваю ничего. Это очень обидно, и я с нетерпением жду момента, когда хотя бы сессия кончится, и я смогу вернуться к анализу данных. Я и сейчас хотя бы вечерами стараюсь хоть чуть-чуть помочь коллегам. В целом работа экспериментаторов была остановлена, и это большая проблема для наших проектов. Как я уже говорил, наша группа всегда старается работать с коллегами-экспериментаторами, потому что любое наше предсказание нужно валидировать экспериментально, иначе это просто компьютерные игры. Либо мы должны опираться на максимально разумные биологические данные: чем больше на входе дополнительной биологической информации, которую мы можем в качестве внешних ограничений наложить на нашу задачу, тем качественнее результат, тем точнее он описывает реальность. Учитывая, что получение этих дополнительных биологических данных остановилось, как и экспериментальная проверка наших гипотез, мы тоже немного сейчас зависли. Мы потратили это время на расчет новых данных, и как только все восстановится, мы сразу же выдадим коллегам пачки новых гипотез. Плюс занимались улучшением наших инструментов. И все-таки как у любой нормальной группы, у нас накоплено большое количество данных, которые мы потихоньку оформляем в манускрипты. За это время мы отправили в журналы уже две или три статьи. — Вы активно занимались популяризацией до пандемии и продолжаете сейчас выступать в онлайн-формате. Изменилось ли отношение аудитории к науке во время пандемии? — Я себя предпочитаю называть скорее научным коммуникатором, чем популяризатором, потому что научная коммуникация — это более широкое понятие, которое включает в том числе общение с коллегами из разных областей. Но популяризация в смысле общения с широкой публикой — тоже часть моей роли как научного коммуникатора. Обычно я рассказываю в первую очередь про свои работы и редко про мою область в целом. И мне на самом деле сложно сказать, изменилось ли отношение, потому что я исходно работаю в основном с теми аудиториями, которым уже интересна наука. Некоторые называют это «проповеди обращенным». В отличие от коллег, от того же Александра Панчина, мне не интересно воевать с любителями мифов, хватает и другой головной боли. За время пандемии аудитория, конечно, немного изменилась из-за перехода в онлайн, и это замечательно. На разных мероприятиях, которые я сейчас посещаю как лектор и как гость, я вижу большое количество людей из регионов. Как правило, в регионах очень мало качественных научпоп-активностей — «Курилка Гутенберга», ФАНК, Geek Picnic и все, пожалуй. И доступ в реальном времени, а не в записи, к мероприятиям, к реальному общению — положительная черта карантина. Хотя, конечно, общаться онлайн с аудиторией — далеко не то же самое, что вести разговор вживую. — Если развенчивать мифы не слишком интересно, в чем ваша основная мотивация заниматься популяризацией? — Для меня это выполнение того, что можно назвать социальным контрактом или общественным договором. Я как исследователь работаю в государственном учреждении, даже в нескольких, и большая часть моих исследований финансируется за счет государственного финансирования — это либо прямые бюджетные деньги, либо гранты государственных научных фондов. В реальности это деньги налогоплательщиков. Соответственно, я чувствую ответственность за эти средства, и считаю, что взамен должен широкой аудитории рассказывать, куда они идут. Это нигде не прописано, в очень редких грантах есть условие рассказывать о том, что в проекте делается. Но только в Российском научном фонде я вижу, что действительно идет работа по продвижению этих результатов, и это, конечно, заслуга замечательной пресс-службы фонда — Марии Михалевой, Юлии Шуляк и их коллег. Так что с одной стороны это такая внутренняя обязанность, но параллельно мне просто нравится рассказывать про свою науку. Я трачу большую часть жизни на свою работу, и мне интересно делиться этим, когда людям нравится узнавать что-то новое, когда я вижу радость в глазах слушателей от того, что им о чем-то интересном рассказали. И, конечно, как фанат своего факультета, я считаю популяризацию одним из инструментов привлечения абитуриентов к нам. — Как вы считаете, работает ли популяризация в этом качестве, как прямой инструмент привлечения? Можно ли ставить глобальную задачу популяризации так: насыщение общества научно-популярной информацией, восстановление престижа профессии ученого и как следствие — привлечение студентов на научно-технические направления? — Можно или нет, уже не играет особой роли, потому что именно так ставят перед собой цели многие коллеги, особенно организаторы фестивалей. В установочных документах они так и прописывают: «наша цель — повысить престиж и технических и научных специальностей, привлечь новых абитуриентов» и т.д. Относительно того, работает это или нет, попробую начать издалека. Я считаю, что до насыщения информацией о науке еще как до Пекина пешком просто потому, что огромное количество людей в регионах банально еще не охвачены этой коммуникацией. И в Москве аудитория у научно-популярных мероприятий на самом деле тоже не такая уж большая. Да, когда ты находишься, назовем это так, в «тусовке», складывается ощущение, что каждый день где-то идут три–четыре параллельные лекции, и приходится все время выбирать, куда сходить, где каких друзей послушать. Но на самом деле огромная часть аудитории еще просто не охвачена, и не потому, что люди этого не хотят. Моя личная практика показывает, что им всегда интересно. Сейчас из-за самоизоляции я много езжу в такси, и когда уезжаю с работы, водители всегда спрашивают: «Из университета?», об этом мы начинаем разговаривать, и ни разу еще не было кого-то, кому было бы не интересно узнать про науку. Так что желание есть, но против людей играет отсутствие свободного времени. У многих семей выживание сейчас, к сожалению, стоит на первом месте, и у людей просто нет, скажем, пространства свободы в голове на досуг. Онлайн частично эту проблему снимает. Например, одно время с коллегами из компании Future Biotech мы делали трансляции на игровые сервисы, такие, как Twitch. Люди туда приходят посмотреть стримы геймеров, и видят рядом какую-то лекцию, заходят посмотреть, что такое странное происходит, и действительно интересуются. Даже таким случайно заскочившим школьникам это интересно, и мне кажется, это все тоже работает на их привлечение. Думаю, это гигантский канал и для привлечения абитуриентов, и для повышения популярности профессии, который мы пока не используем. И это наша гигантская проблема, потому что в России люди в целом не очень понимают, что такое наука, чем ученые вообще занимаются. Что ходить далеко — я сам, как человек из маленького индустриального города, до поступления в университет вообще не знал, как работает академическая наука, зачем ученым стажировки, что такое публикации. А импакт-факторы, рейтинговые журналы, квартили вообще были понятиями из другой вселенной. — То есть усилия популяризаторов сейчас нужно сосредоточить на том, чтобы захватить новые площадки? — Представленность, конечно, нужно повышать. Но вообще «нужно» — плохое в этом смысле слово. Потому что по крайней мере в моем окружении все коллеги и друзья, кто занимается популяризацией, делают это просто for fun. И для меня эта мотивация тоже главная. Если бы я не получал профессиональное удовольствие от процесса, я бы этим, конечно, не занимался. Разумеется, если в условиях грантов нам будут писать «напишите популярную статейку», все будут писать, но что из этого выйдет, другой вопрос. Хорошая научная коммуникация, как и любая работа, требует времени, усилий, подготовки. Нужно изучить теоретическую базу в этой области, понять, какие есть стратегии коммуникации, как, что и кому стоит рассказывать, какие приемы можно использовать, от каких стоит воздержаться, как ваши знания распылять по аудитории, по площадкам. Надо определить удобные для себя форматы и площадки, потому что тут тоже много нюансов. Я знаю немало замечательных лекторов, которые вживую выступают изумительно, но, если их посадить перед камерой с той же темой, более унылого зрелища вы не найдете. И я считаю, что заставлять людей заниматься коммуникациями категорически нельзя. Можно к этому побуждать, привлекать, показывать, какие есть возможности, давать попробовать. Но заставить быть научный коммуникатором невозможно, это совершенно провальная стратегия. Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще. Подписывайтесь на Indicator.Ru в соцсетях: Facebook, ВКонтакте, Twitter, Telegram, Одноклассники.