Ученые Питерской Вышки начнут обучать искусственный интеллект эмоциям

Лаборатория естественного языка НИУ ВШЭСанкт-Петербург под руководством кандидата технических наук Дмитрия Рюмина приступает к исследованиям в области многомодальных технологий, которые позволят нейросетям распознавать не только слова, но и эмоции, жесты и личностные характеристики человека.

Ученые Питерской Вышки начнут обучать искусственный интеллект эмоциям
© РБК Компании

«Сегодня мы выходим за рамки простого взаимодействия с ИИ — мы учим его понимать человеческую природу во всей ее сложности. Речь про систему, которая не просто анализирует тексты, а одновременно распознает голос человека, его мимику, жесты и эмоциональное состояние. Наша задача — сделать искусственный интеллект не только умным, но и эмоционально грамотным, способным объяснить, почему он пришел к тому или иному выводу», — Дмитрий Рюмин, руководитель Лаборатории естественного языка НИУ ВШЭСанкт-Петербург.

Исследования в области многомодальных технологий найдут применение в различных сферах.

HR и подбор персонала: системы будут анализировать не только содержание ответов соискателя, но и его эмоции, интонации, жесты, помогая HR-специалистам получить более полное представление о кандидате.

Персонализированная реклама: нейросети смогут адаптировать контент под эмоциональное состояние пользователя.Виртуальные пространства: эмоциональные аватары сделают общение на онлайн-конференциях более реалистичным.Технологии переноса движений: позволят создавать виртуальные видео с реалистичными движениями.Психологическая поддержка: распознавание не только кратковременных эмоций, но и долгосрочных состояний, таких как тревожные расстройства или эмоциональное выгорание.Усовершенствованные голосовые помощники: бимодальное распознавание эмоций сделает взаимодействие с умным домом более естественным.

Еще одна задача Лаборатории естественного языка НИУ ВШЭСанкт-Петербург — обеспечить прозрачность процесса принятия решений нейросетью. «Для применения ИИ в медицине или психологии недостаточно, чтобы модель просто диагностировала депрессию или определяла эмоциональное состояние человека. Важно, чтобы система объясняла, почему она пришла к такому выводу», — подчеркивает Дмитрий Рюмин.

Для современных исследований многомодальных моделей требуется мощная техника, кросс-дисциплинарные специалисты и большие объемы данных. «На примере суперкомпьютера Высшей школы экономики мы видим, как эти ресурсы влияют на качество научных экспериментов. Особенно ценно привлекать к работе с такими системами студентов, начиная с бакалавриата, — обучать их взаимодействию с высокопроизводительными вычислительными кластерами, давать возможность тренировать модели различной сложности», — рассказывает Дмитрий Рюмин.

Для обучения нейросетей используются как традиционные базы данных, так и автоматизированный сбор эмоционально окрашенных материалов с помощью открытых ИИ-систем. Кроме того, современные исследования в области многомодальных моделей предполагают междисциплинарность, поэтому в Лаборатории естественного языка смогут работать студенты и аспиранты, которые разбираются в программировании, лингвистике, психологии или социологии.

«Мы стремимся привлекать специалистов с разносторонней подготовкой — например, тех, кто получил бакалаврское образование в лингвистике, а затем продолжил развиваться в ИТ-направлении. Такие специалисты обладают глубоким пониманием лингвистических аспектов и при этом могут работать с нейросетевыми моделями», — Дмитрий Рюмин руководитель Лаборатории естественного языка НИУ ВШЭСанкт-Петербург.

Лаборатория естественного языка занимается междисциплинарными исследованиями в области машинного обучения и обработки естественного языка. Специалисты изучают фундаментальные свойства языка, вычислений и обучения, которые могут способствовать лучшему пониманию языка в целом.