"ГигаЧат" получил расширенную языковую поддержку народов России и стран СНГ
ИИ-помощник "ГигаЧат" получил расширенную языковую поддержку.
Как рассказали "РГ" в пресс-службе компании, качество обработки текстов улучшено более чем на 30 языках народов России и стран СНГ, в числе которых татарский, башкирский, чувашский, удмуртский, якутский, бурятский, осетинский, чеченский и карачаево-балкарский.
Как отметили разработчики, для каждого языка модель дорабатывалась отдельно на основе специально подготовленных обучающих данных.
В подготовке обучающих наборов приняли участие ФГБУ "Дом народов России", интернет-энциклопедия "Рувики", региональные академии наук, образовательные и научные организации, а также некоммерческие структуры, занимающиеся сохранением языкового и культурного наследия.
Нововведение реализовано в текстовом формате. Пользователь может указать предпочтительный язык общения, после чего система формирует ответы на нем при соответствующих запросах. Доступны поиск информации, помощь в обучении, подготовка текстов, а также взаимодействие с цифровыми сервисами.
Разработчики платформы отмечают, что при создании учитывалась ограниченная представленность многих национальных языков в цифровом пространстве, а для сбора и верификации данных привлекались профильные организации и носители языков, участвовавшие в разметке текстов и оценке качества ответов.
Заявлено, что модель создана российскими специалистами и прошла полный цикл разработки - от подготовки данных до финальной оценки качества - на отечественной технологической инфраструктуре.
Обновленная версия "ГигаЧата" доступна для бесплатного тестирования в веб-версии и мобильных приложениях для Android в RuStore и AppGallery, а также в мессенджерах.
Развитие цифровых сервисов для национальных языков ведется и в других проектах. Ранее сообщалось о расширении их поддержки в "Яндекс Переводчике": в последние годы в сервис были добавлены, в частности, карачаево-балкарский и кабардино-черкесский языки, а общее число языков народов России в нем постепенно увеличивается . Работа по их интеграции ведется при участии профильных организаций и направлена на расширение присутствия языков в цифровой среде.
Ранее также сообщалось о развитии экосистемы ИИ-решений: в частности, о применении модели Kandinsky AI в работе художественного ИИ-агента, а также о появлении у бизнеса возможности создавать рассуждающих ИИ-агентов для решения прикладных задач.