Российские ученые разработали новую математическую модель распознавания речи, которая превосходит аналоги по точности и позволяет корректно идентифицировать говорящего, передает РИА «Новости» со ссылкой на Проектный офис «Приоритет 2030» Томского государственного университета систем управления и радиоэлектроники (ТУСУР).
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», – заявил замдиректора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР Антон Конев.
Исследователи отметили, что у новой системы погрешность при распознавании основного тона речи в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет лучше справляться с распознаванием обычной спонтанной речи или пения.
Авторы разработки отметили, что эта возможность поможет, например, общаться с «умными» системами не с помощью формальных команд, а практически как с живым собеседником. Она особенно эффективна при распознавании аббревиатур, а также слов и фраз, которые редко встречаются.
«Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении «умной» техникой», – добавил Конев.
Еще одним результатом работы ученых должна стать система продленной аутентификации, которая в течение всего сеанса связи позволит удостоверять личность собеседника. Это функция полностью исключит некоторые типы мошенничества.
Ранее сообщалось, что исследователи научили роботов проявлять чувства. Они разработали технологию, позволяющую роботам распознавать эмоции в человеческой речи и затем воссоздавать их в собственной, меняя интонации и ритм.