Нейросеть Kandinsky заняла первое место среди всех open-source решений
Нейросеть для генерации видеороликов Kandinsky 5.0 Video от Сбера оказалась в числе лидеров в престижном рейтинге платформы LMArena от исследователей из Калифорнийского университета в Беркли.
Kandinsky 5.0 Video Lite — компактная модель на 2 миллиарда параметров. При этом она показала лучшие результаты, чем первая версия знаменитой Sora от OpenAI. Также Kandinsky 5.0 Video Lite хорошо знает российский культурный код, нативно понимает запросы как на русском, так и на английском языках и генерирует надписи на латинице и кириллице.
В свою очередь, модель Pro в рейтинге LMArena оказалась в одном ряду с актуальными флагманскими продуктами мировых лидеров. Она стала лучшей среди всех аналогов с открытым кодом — это означает, что любой разработчик может свободно использовать её код для своих проектов. Места выше заняли только закрытые модели Veo 3.1 и Veo 3 от Google DeepMind, Sora 2 (OpenAI), Wan 2.5 (Alibaba) и модели Kling 2.6, Kling 2.5 от KlingAI. А с такими решениями, как Ray 3 от Luma AI и Hailuo 2.3 от MiniMax, разработка Сбера показала паритет.
Рейтинг LMArena работает как открытый турнир. В рамках Video Arena пользователи напрямую сравнивают результаты разных нейросетей. На основе миллионов таких сравнений система формирует честный и прозрачный рейтинг.
Научное сообщество также высоко оценило работу специалистов Сбера. Подробный технический отчёт о разработке Kandinsky 5.0 был опубликован 19 ноября в рамках международной конференции AI Journey («Путешествие в мир искусственного интеллекта»). Документ сразу возглавил рейтинг Daily Papers на Hugging Face. Сначала он стал лучшим за день, затем за неделю, а потом и за весь месяц.