В РФ ускорили обучение генеративных систем искусственного интеллекта
МОСКВА, 5 декабря. /ТАСС/. Исследователи из России разработали новый подход к решению обширного класса сложных оптимизационных вычислительных задач, чья разработка позволит в 3-10 раз ускорить обучение широкого перечня генеративных систем машинного обучения. Об этом сообщила пресс-служба Института искусственного интеллекта AIRI.
"Наш подход может применяться в самых разных областях. В частности, мы применяли его для обучения имитации - когда эксперт показывает определенные действия, агент пытается имитировать поведение, и система оценивает, насколько действия агента похожи на действия эксперта. Примером может служить урок танцев, когда преподаватель показывает движение, а ученик пытается его повторить", - пояснил руководитель научной группы в AIRI Назар Бузун, чьи слова приводит пресс-служба института.
Как отмечается в сообщении, Бузун и его коллеги предложили новый подход к решению задачи оптимального транспорта, в изучение которой внес большой вклад советский математик и экономист Леонид Канторович. В ее рамках необходимо составить план перевозки продукта из пунктов производства в пункты потребления с минимальными затратами средств на логистику или же за минимальное время и расстояние.
В последние годы эта задача и уже существующие подходы для ее решения начали активно использоваться при обучении генеративных систем искусственного интеллекта, способных вырабатывать изображения или тексты, а также для адаптации ИИ к работе с данными из новых источников. По словам исследователей, при использовании этих оптимизационных алгоритмов разработчики ИИ часто сталкиваются с тем, что обучение становится нестабильным, или же он начинает требовать тонкой подстройки и сложных промежуточных преобразований.
Российские исследователи решили обе этих проблемы, внедрив еще один математический инструмент, так называемую энтропийную регуляризацию, которая сейчас активно применяется физиками при решении сложных вычислительных термодинамических задач. Он позволяет "стягивать" генерируемое к ожидаемому и тем самым ускорять вычисления в 3-10 раз в процессе обучения систем искусственного интеллекта.
Работу этого подхода ученые проверили как на относительно простых наборах двумерных данных, так и при решении более сложных задач, в которых системы ИИ проводили перенос стиля или реконструкцию трехмерных объектов. Новый подход справился со всеми этими задачами, что продемонстрировало его универсальность. По словам исследователей, их методика уже была внедрена в библиотеку ott-jax, одно из самых популярных в мире решений, связанных с задачами оптимального транспорта.