В Сбере заявили о способности GigaChat на равных конкурировать с нейросетями других стран
Нейросетевая модель Сбера GigaChat находится в одной весовой категории с прочими большими языковыми моделями, в том числе и представленной китайскими разработчиками DeepSeek. Об этом в интервью «Коммерсанту» рассказал первый заместитель председателя правления Сбера Александр Ведяхин.
Он отметил, что в Сбере протестировали DeepSeek, сравнили ее с моделью GigaChat и считают появление китайской языковой модели большим плюсом для всего рынка.
Топ-менеджер компании назвал эту модель лучшей среди подавляющего большинства аналогов с открытым кодом.
«Мы искренне рады за китайских коллег и за прогресс в области построения больших языковых моделей и машинного обучения в целом. Появление такой модели на рынке подчеркивает важность развития открытых решений», — заявил Александр Ведяхин.
Он напомнил, что Сбер давно и активно публикует различные модели генеративного искусственного интеллекта. В открытый доступ выложены все модели линейки Kandinsky, базовая модель GigaChat Lite, семейство акустических моделей для русского языка GigaAM, которые находятся «под капотом» сервиса GigaChat.
Ведяхин добавил, что российские разработчики сейчас ограничены в объеме вычислительных ресурсов.
По его словам, следуя подходу китайских коллег, в Сбере намерены сфокусироваться на оптимизации процесса обучения моделей, стремясь получать лучшие метрики с меньшими затратами.
Кроме того, Ведяхин подчеркнул, что Китай является партнером России по многим вопросам международной повестки, поэтому уровень научного взаимодействия между двумя странами должен быть усилен с помощью кооперации между учеными.
Он отметил, что в Сбере работает много ученых, которые выступают на ведущих мировых конференциях, общаются с коллегами из разных стран.