Почему на разных языках говорят с разной скоростью?
Если вы когда-нибудь пробовали смотреть фильмы на иностранных языках, то наверняка замечали, что они звучат непривычно быстро. И это правда — у многих языков скорость устной речи различается. Портал popsci.com рассказал, почему.
Исследование от 2011 года измерило скорость устной речи на семи языках, и японский оказался первым. Ученые обнаружили, что люди, говорящие на японском, произносят в среднем 7,84 слогов в секунду, тогда как на английском — лишь 6,19.
Итоги не удивляют, если подумать о том, как мы говорим на этих языках. В английском есть много слогов, содержащих множество звуков, тогда как в японском и многих других языках каждый слог содержит значительно меньше звуков. То есть, скорость произношения слогов в секунду выше. Переводя статистику в цифры, японский язык примерно на 20% быстрее английского, но при этом люди, владеющие этими языками, могут смотреть фильм в дубляже с одинаковым хронометражом. Отчасти — благодаря творческому подходу к дубляжу, но дело также и в том, как два языка передают смыслы.
В середине XX века американский полимат Клод Шэннон сделал большой вклад в математику, электрическую инженерию и информатику благодаря своей работе над теорией информации. Шэннон, придумавший термин «бит» в значении единицы информации, изучал, как человеческая речь доносит смыслы. В 1951-м он заявил, что английский язык на 80% избыточен — каждую 4 из 5 букв можно вырезать, не потеряв смысла.
Подсчеты Шэннона были немного строгими — более свежие попытки анализа скорректировали цифру с 80% до 50%. Однако его базовая теория прошла проверку временем: каждый язык доносит смыслы с разной плотностью, и простой анализ скорости устной речи упускает этот фундаментальный фактор.
В 2019 году исследователи из Лионского университета попытались определить, как распределен баланс между скоростью речи и плотностью информации на примере 170 человек, читавшими одни и те же тексты на 17 языках. Самый медленный читал со скоростью 4,3 слога в секунду, тогда как самый быстрый достиг скорости 9,1, тем самым продемонстрировав, что скорость сильно варьируется.
Но самым интересным стал анализ плотности информации каждого языка. Ученые отталкивались от оригинальной теории Шэннона, чтобы рассчитать условную энтропию слогов в языках — другими словами, насколько сложно предугадать следующий слог, основываясь на предыдущем. Так, вьетнамский язык был одним из самых медленных, но при этом оказался одним из самых насыщенных по плотности информации. Людям, говорящим на вьетнамском, нужно произносить меньше слогов, чтобы донести информацию до собеседника, чем испаноговорящим людям.
Объединив обе метрики, французские исследователи создали новый параметр — коэффициент информации, определяющий, как много данных язык может передавать в секунду. Причем этот коэффициент так незначительно варьировался между языками, что ученые смогли прийти к «универсальному» значению — 39 бит в секунду. По их предположению, эта цифра может быть примерным потолком скорости обработки речи человеческим мозгом.
Тем не менее, эксперимент в Лионском университете не был идеальным. Он не воспроизвел нюансы повседневной речи, поскольку все участники опыта читали предопределенные тексты. Исследователям еще только предстоит выяснить, меняется ли коэффициент информации в более естественных лингвистических условиях.