Российские книжные издательства и сервисы начали использовать ИИ для озвучивания аудиокниг

В России книжные издательства и сервисы начали использовать технологии искусственного интеллекта (ИИ) для озвучивания книг. В будущем это поможет ускорить и удешевить процесс, увеличить продажи. Эксперты отметили, что технология полноценно не может заменить диктора и подходит не для всей литературы. Об этом написал «Коммерсантъ».

В РФ начали использовать ИИ для озвучивания аудиокниг
© Unsplash

Книжный сервис «Строки» в этом году планирует озвучить более 10 тысяч произведений с помощью ИИ. В работе не первом этапе уже находятся 600 произведений. Их запишут с помощью платформы Audiogram. В основе неё используется машинное обучение, технологии обработки естественного языка (NLP) и нейронные сети. Она позволяет расставлять ударения, паузы, воспроизводить интонации. ГК «ЛитРес» (сервисы MyBook, Livelib, «ЛитРес» и другие) тоже озвучивает аудиокниги с помощью искусственного интеллекта с осени прошлого года. Она основывается на технологии SpeechKit, которая распознает и синтезирует речь. С её помощью работает голосовой помощник «Алиса». С помощью SpeechKit озвучили более 100 тысяч часов аудиокниг.

В прошлом году «ЛитРес» озвучил «живыми голосами» примерно 6 тысяч книг. С помощью ИИ озвучили в течение двух месяцев 3 тысячи книг.

Озвучка одной книги с помощью искусственного интеллекта равна 400-700 рублям.

По данным МТС, у более 90% книг на российском рынке нет аудиоверсии. Их озвучивание вживую заняло бы годы, сообщили в компании. В то время как подготовка первоначальной версии аудиокниг с помощью ИИ занимает полчаса-час. Запись в студии живым голосом до нескольких дней с учётом монтажа.

Расходы на озвучивание произведения за счёт искусственного интеллекта сократят расходы в десять раз, сообщили в компании. Работа диктора за озвучивание одной книги оценивается в 50 тысяч рублей.

Николай Боронин, руководитель аудиопроектов Alpina Digital (группа «Альпина») рассказал, что компания озвучила с помощью ИИ 86 книг. По его словам, диктора не может заменить даже хороший ИИ. Придирчивые слушатели могут отказаться от использования таких произведений из-за неестественного интонирования, несовершенного голоса.

В этом году «ЛитРес» намерен усовершенствовать процесс записи: помогать ИИ верно интонировать, добавить ударения сложным словам, дополнительно размечать текст.