Андрей Окуньков: о красоте задач и роли математики в технологиях
Математика - это универсальный язык, на котором мы можем одинаково точно описать поведение элементарных частиц и работу нейросетей. Она соединяет фундаментальные законы природы и современные технологии, позволяя нам не просто фиксировать знания, но и открывать новое. В интервью с Андреем Окуньковым, математиком, лауреатом Филдсовской премии, мы говорим о пути современного ученого, о красоте математических задач, о роли математики в развитии искусственного интеллекта и о том, как фундаментальные открытия могут стать основой технологических прорывов.
Вы прошли путь от математической экономики до математической физики, от жизни в России до преподавания за рубежом. Что стало решающим в выборе профессии и какие вехи на вашем пути были особенно яркими?
В математику я пришел из математической экономики, переведясь с экономфака МГУ на механико-математический факультет, после службы в армии. Экономикой я занялся потому, что интересовался людьми и человеческим обществом, а математическая экономика мне представлялась самым строгим и научным способом этот мой интерес утолять. Не то чтобы я потерял интерес к людям, скорее понял, что математика мне дается легче. И кстати, всегда советую молодежи выбирать себе ту сферу деятельности, которая им дается легче и естественнее всего.
Экономическому факультету я обязан и встречей со спутницей моей жизни, Инной, многими друзьями, и первоначальному вектору в моих занятиях математикой. В математике у меня были замечательные учителя - сначала А.А. Кириллов, а потом Г.И. Ольшанский. Они занимались теорией представлений (не путать с цирковыми!). Это важная область математики, которая началась из нужд квантовой физики, и до сих пор помогает в решении многих естественнонаучных проблем.
Мир физический ничуть не менее интересен, чем мир человеческий, и легче поддается математическому описанию. Вот так и занимаюсь всю жизнь математической физикой, что подразумевает и задачи квантовой физики, которую я уже упоминал, и задачи статистической физики, которая изучает поведение систем, состоящих из гигантского числа микроскопических частиц, например молекул в жидкости или газе, и многое другое.
Мехмат я окончил в 1993 году, непростое было время. Математика с тех пор, конечно, сильно изменилась. Численные вычисления уже тогда играли огромную роль, но большинство математиков-теоретиков использовали компьютер только для того, чтобы читать электронную почту и редактировать статьи. Какие возможности для нас с тех пор открылись!..
Сегодня математика охватывает колоссальное количество направлений, и вряд ли возможно описать, что происходит в каждом из них, в нескольких словах. Но если говорить в целом - что сейчас занимает научные умы?
Математика - наука совершенно гигантская и вширь, и вглубь, как и подобает науке, способной описать и весь наш мир, и все воображаемые миры тоже. Математики в чем-то всесильны, а в чем-то бессильны. С одной стороны, некоторые невообразимо сложные и важные задачи удается по-настоящему решить, а с другой стороны, многие, казалось бы, элементарные вопросы, суть которых можно объяснить пятикласснику, стоят практически без движения сотни лет. И зачастую математиков интересует, почему некоторые задачи решаются, а некоторые - нет.
К подобным примерам, на первый взгляд, элементарных, но нерешаемых задач можно отнести проблему Гольдбаха. На заре цивилизации люди осознали важность простых чисел, то есть целых чисел, которые делятся только на 1 и само себя. Например, к ним относятся 2, 3, 5, 7, 11, 13, 17, 19, 23 и последующие. Еще Евклид доказал, что их бесконечно много. А в 1742 году в переписке российско-прусских математиков Гольдбаха и Эйлера родилась гипотеза: каждое четное число, начиная с 4, есть сумма двух простых. Этот и бесчисленное множество других "элементарных" фактов так и остаются для математиков загадкой.
Я бы думал что больше всего математиков интересует, почему некоторые задачи решаются, а некоторые - нет. Звучит, конечно, философски, но на самом деле такая постановка вопроса имеет самое прямое отношение к нашей теме. Если знать общие контуры решения, то поиск и проверку их деталей можно спокойно поручить компьютеру. А вот отсутствие решения тесно связано с таким понятием, как алгоритмическая сложность. Эта алгоритмическая сложность преграждает дорогу не только чересчур оптимистичным первопроходцам, но и мошенникам, которые пытаются подобрать ключи к современным криптосистемам.
Красота математики в том, что трудные задачи всегда требуют привлечения новых идей и понятий для их решения. И нет никакого способа заранее знать, что же может потребоваться. Что только не потребовалось Эндрю Уайлсу в его доказательстве теоремы Ферма, а ведь никакого другого доказательства мы не знаем после почти 400 лет поисков.
Кстати, размышляя о теореме Ферма, Эйлер предположил, что нет решений и у уравнения a^4 + b^4 + c^4 = d^4. Люди проверяли это на компьютере, и не нашли контрпримеров. Но используя теорию эллиптических кривых - которые и у Уайлса играют центральную роль, хотя и совершенно иную), - Элкис в 1988 году нашел решение 2682440^4 + 15365639^4 + 18796760^4 = 20615673^4. Если знать, где искать…
Вы упомянули, что компьютеры помогают проверять гипотезы и искать решения, но по-настоящему сложные задачи требуют совершенно новых подходов. Сегодня многие такие подходы рождаются и в машинном обучении. Какой вы видите роль математики в развитии ML и в будущем науки в целом?
Это действительно важный вопрос, и отчасти этому будет посвящена моя ближайшая лекция "Математика и язык" на Practical ML Conf. Речь пойдет о том, как абстрактные математические понятия находят свое выражение в человеческом языке, и о том, как люди и машины, оперируя словами этого математического языка, находят пути развития математического знания и решения задач, перед наукой стоящих.
Это совсем не прямолинейный и многоуровневый процесс. Например, есть в нем и такая, в чем-то очень досадная составляющая. Все математические книги и статьи, когда-либо написанные на планете, представляют собой, конечно, с одной стороны, целый океан знания, а с другой - это просто капля в том настоящем море информации, которым нынче располагают и манипулируют языковые модели.
Вот предположим, прочитали мы все эти материалы, и задают нам вопрос: решена уже или еще не решена какая-то конкретная математическая проблема. Казалось бы, что может быть проще? Не надо вырабатывать никакого нового знания, просто сказать "да" или "нет", содержится ли данное утверждение в уже пройденном материале?
Но не все так просто. Мы же не просто ищем данное сочетание слов или понятий в литературе. Например, может быть уже решена не данная конкретная задача, а более общая. Зачастую это совсем не очевидно, что данная задача сводится, как частный случай, к чему-то более общему. Это на самом деле известное узкое место в процессе познания, замеченное задолго до появления больших языковых моделей.
Людям больше нравится обобщать, и это у них лучше получается. И мало кто хочет тратить время и мыслительные способности на частные случаи. Ну, хорошо, раз людям нравится обобщать, то, наверное, и машины у людей этому быстро научатся и тогда смогут пытаться обобщить задачу до тех пор, пока она не превратится в уже решенную. Но тут есть и много других проблем, более серьезных.
Давно стало общепринятым говорить, что математика едина и что это своего рода единый организм. Это, конечно, так, но язык, на котором разные области математического знания говорят, очень разный. И может сложиться такая ситуация: в области А специалисты уже почти решили важную задачу, осталось только подобрать ключ к последнему замку. Однако специалисты в области Б, используя совершенно другие слова для описания, по сути, тех же самых понятий, давно уже знали, как этот замок открывается, но понятия не имели, что это их знание полезно в области А. Приходится ждать или появления человека, который разговаривает на двух языках, или появления алгоритма, способного понять суть дела и ответить, что, да, задача решена.
Насколько облегчится жизнь профессиональных ученых, когда подобные алгоритмы станут реальностью! Поиск ответов на такого рода вопросы нам будет казаться настолько же непродуктивной и архаичной составляющей работы ученого, как очинка гусиных перьев.
Возвращаясь к Practical ML Conf, я очень рад шансу снова встретиться с коллегами из "Яндекса" и принять участие в этом мероприятии. Помню, как меня поразил профессионализм компании в тот период, когда мы вместе работали над подготовкой Международного математического конгресса в Санкт-Петербурге. Очень рад, что "Яндекс" продолжает поддерживать и развивать математику в России на самых разных уровнях. В частности, в компании есть своя научная лаборатория Yandex Research, крупные R&D-команды и сильные исследователи.
Большие технологические компании способны инвестировать в исследования: и те, которые могут не привести к практическим решениям, и те, у которых горизонт воплощения может занимать 5-10 лет. Такой союз академии и индустрии позволяет не только создавать продукты "здесь и сейчас", но и закладывать фундамент для будущих технологических стандартов. При этом исследователи получают поддержку со стороны компаний и остаются в диалоге с мировым научным сообществом: публикуют результаты, участвуют в международных проектах, обсуждают идеи с коллегами по всему миру. Это тоже толкает развитие науки.
Какую роль математика играет в нашем понимании мира и в развитии технологий?
Хотя я всю жизнь опираюсь на компьютерные вычисления, я не считаю себя специалистом на стыке математики и компьютерных наук. Но могу сказать: роль математики здесь трояка. Во-первых, она формирует наше мышление о мире. Во-вторых, все алгоритмы, которыми живет ИТ, сотканы из математических задач - как решенных, так и нерешенных. И наконец решения по-настоящему сложных задач становятся проверкой и для надежности алгоритмов, и для "интеллектуальности" самих интеллектов.
Главное достоинство математики - ее точность. Она дает правильный ответ не в 51% случаев, не в 99,9% случаев, а всегда. Именно эта строгость во многом позволяет создавать технологии, на которых держится современный мир - от мобильных телефонов до квантовой физики и искусственного интеллекта. При этом крупнейшие открытия науки начинались, образно выражаясь, с небольшой щелки, небольшого просвета в "практически законченных" зданиях тогдашних воззрений. Если бы наши предки закрыли на них глаза, мы бы, наверное, до сих не знали учения Коперника, не говоря уже о квантовой физике или теории относительности.