Учёные из Научно-исследовательского института AIRI и Сколтеха разработали новый метод, который позволяет ускорить обучение генеративных моделей в 3−10 раз. Этот подход основан на использовании методов Оптимального Транспорта (ОТ), которые активно применяются в машинном обучении для решения сложных вычислительных задач. Результаты исследования будут представлены на одной из крупнейших мировых ИИ-конференций NeurIPS 2024 в Ванкувере.
Методы оптимального транспорта используются для генерации искусственных данных, таких как изображения или тексты, а также для решения задач в обучении с подкреплением, включая медицину. Однако существующие методы часто сталкиваются с проблемами, такими как нестабильность обучения и сложные преобразования. Новый метод, предложенный учеными, решает эти проблемы с помощью внедрения энтропийной регуляризации, что значительно ускоряет вычисления и повышает качество работы моделей.
Метод был протестирован на задачах генерации изображений, переносе стиля и реконструкции трехмерных объектов, что показало его универсальность и эффективность.