Исследование, проведенное Центром ARC по автоматизированному принятию решений и обществу при Университет Нового Южного Уэльса (Сидней) совместно с Квинслендский технологический университет, показывает: искусственный интеллект способен восстанавливать персональные данные о человеке, анализируя только рекламу, которую он видит онлайн.
Ранее подобные профили тоже строились алгоритмами, но они опирались в основном на явно заданные признаки и статистические модели с ограниченным числом параметров — например, историю поиска, клики или демографические данные, заранее размеченные человеком. В случае современных ИИ-моделей анализ становится менее прозрачным и более «глубоким»: система способна извлекать скрытые корреляции из разнородного контента (например, набора рекламных объявлений), не требуя явных сигналов и не объясняя, какие именно признаки использовались. Это делает процесс менее контролируемым и затрудняет понимание того, какие именно выводы и с какой точностью система делает о человеке.
Ученые изучили более 435 тысяч контекстных реклам в социальных сетях и поведение 891 пользователя в рамках проекта Australian Ad Observatory. Результат оказался неожиданным: даже без доступа к истории браузера или личным данным можно достаточно точно вывести политические взгляды, уровень образования и занятость человека.
По сути, рекламная лента сама по себе формирует информационный след, который можно «прочитать» с помощью больших языковых моделей.
Исследователи применили современные LLM-модели и обнаружили, что они способны:
При этом длительное наблюдение за пользователем оказалось необязательным — достаточно коротких сессий просмотра.
В докладе для конференции ACM Web Conference 2026, которая ежегодно объединяет ведущих специалистов в области веб-технологий, анализа больших данных и систем искусственного интеллекта, исследователи отмечают:
«Наши результаты демонстрируют, что готовые LLM-модели могут точно восстанавливать сложные частные атрибуты пользователей». «Важно отметить, что создание профилированных данных, позволяющих принимать обоснованные решения, возможно даже в течение коротких периодов наблюдения, что указывает на то, что длительное отслеживание не является необходимым условием для успешнго извлечения таких данных».
ИИ уже сейчас, только через анализ показываемой рекламы, может делать такие выводы:
По словам ведущего автора Байю Чен, рекламные системы изначально не случайны:
«Ключевой момент заключается в том, что реклама, которую видит человек, не случайна. Общая картина рекламы может нести сигналы о таких характеристиках, как пол, возраст, образование, статус занятости, политические предпочтения и более широкое социально-экономическое положение. Наше исследование показывает, что ИИ могут анализировать эти закономерности и делать выводы о личных характеристиках на основе одной лишь рекламы».
Авторы подчеркивают, что речь идет не о гипотезе, а о воспроизводимом механизме. Потоки рекламы фактически работают как цифровой отпечаток пользователя, который можно анализировать вне платформы. Эти результаты впервые предоставляют эмпирические доказательства того, что рекламные потоки служат высокоточным цифровым следом, подчеркивая системную уязвимость в рекламной экосистеме
Отдельно отмечается риск расширений браузеров, которые имеют доступ к содержимому страниц:
«Мы определили расширения для браузеров, злоупотребляющие законными привилегиями, как потенциальный основной вектор этой атаки»
Даже при ограничениях со стороны платформ реклама все равно косвенно «выдает» особенности пользователей. Из отдельных объявлений и их набора можно восстановить личные характеристики, даже не имея прямого доступа к данным человека.
По мнению исследователей, решить эту проблему только техническими средствами не получится. Нужны и правила на уровне регулирования, потому что полностью убрать этот риск со стороны пользователя нельзя — он заложен в самой системе онлайн-рекламы.