«Яндекс. Переводчик» создаст голосового помощника на карачаево-балкарском языке

После добавления кабардино-черкесского и карачаево-балкарского языков в «Яндекс. Переводчик» планируется создать голосового помощника на карачаево-балкарском языке. В ресурс также включат разные диалекты и говоры, сообщил «Это Кавказ» один из разработчиков, дата-сайентист Богдан Теунаев.

«Яндекс. Переводчик» создаст голосового помощника на карачаево-балкарском языке
© «Это Кавказ»

«В перспективе — полноценный голосовой помощник на карачаево-балкарском языке. Про переводчик мы не забываем: будем дополнять его разными диалектами и говорами карачаево-балкарского языка», — сказал он.

Создание системы распознавания речи в текст и обратно и обучение языковой модели на основе собранного для электронного переводчика материала также входит в круг интересов разработчиков.

«Мы собрали 289 тысяч пар предложений и обучили на нем первую карачаево-балкарскую нейросетевую модель перевода. Так, передали в Яндекс наш карачаево-балкарский параллельный корпус, а кабардинский языковой активист Анзор Кунаш передал кабардино-русский — 220 тысяч пар. Стандартный датасет Яндекса из 100 тысяч предложений переводился в КБР силами организации „Черкесский Ренессанс“, нанявшей для этой цели школьных учителей кабардинского и балкарского языков», — рассказал второй создатель переводчика на карачаево-балкарский язык, аналитик, кандидат технических наук Али Берберов.

Отмечается, что такая же работа велась и в Карачаево-Черкесии — на базе Карачаево-Черкесского института гуманитарных исследований имени Х. Хапсирокова.