ИИ научился определять личные данные по рекламной ленте человека

04 мая 2026, 15:44

Исследование, проведенное Центром ARC по автоматизированному принятию решений и обществу при Университет Нового Южного Уэльса (Сидней) совместно с Квинслендский технологический университет, показывает: искусственный интеллект способен восстанавливать персональные данные о человеке, анализируя только рекламу, которую он видит онлайн.

Ранее подобные профили тоже строились алгоритмами, но они опирались в основном на явно заданные признаки и статистические модели с ограниченным числом параметров — например, историю поиска, клики или демографические данные, заранее размеченные человеком. В случае современных ИИ-моделей анализ становится менее прозрачным и более «глубоким»: система способна извлекать скрытые корреляции из разнородного контента (например, набора рекламных объявлений), не требуя явных сигналов и не объясняя, какие именно признаки использовались. Это делает процесс менее контролируемым и затрудняет понимание того, какие именно выводы и с какой точностью система делает о человеке.

Реклама это источник скрытых данных

Ученые изучили более 435 тысяч контекстных реклам в социальных сетях и поведение 891 пользователя в рамках проекта Australian Ad Observatory. Результат оказался неожиданным: даже без доступа к истории браузера или личным данным можно достаточно точно вывести политические взгляды, уровень образования и занятость человека.

По сути, рекламная лента сама по себе формирует информационный след, который можно «прочитать» с помощью больших языковых моделей.

Как работает метод

Исследователи применили современные LLM-модели и обнаружили, что они способны:

восстанавливать личные характеристики без истории просмотров
строить профиль человека на основе коротких фрагментов рекламы
работать точнее и стабильнее, чем люди в аналогичной задаче
делать это в 50 раз быстрее и более чем в 200 раз дешевле

При этом длительное наблюдение за пользователем оказалось необязательным — достаточно коротких сессий просмотра.

Что говорят авторы

В докладе для конференции ACM Web Conference 2026, которая ежегодно объединяет ведущих специалистов в области веб-технологий, анализа больших данных и систем искусственного интеллекта, исследователи отмечают:

«Наши результаты демонстрируют, что готовые LLM-модели могут точно восстанавливать сложные частные атрибуты пользователей». «Важно отметить, что создание профилированных данных, позволяющих принимать обоснованные решения, возможно даже в течение коротких периодов наблюдения, что указывает на то, что длительное отслеживание не является необходимым условием для успешнго извлечения таких данных».

ИИ уже сейчас, только через анализ показываемой рекламы, может делать такие выводы:

политические предпочтения
вероятная идеологическая ориентация
уровень образования
статус занятости (работает/не работает/тип занятости)
пол, возраст, раса
общее социально-экономическое положение
косвенные признаки уровня дохода или жизненного этапа

По словам ведущего автора Байю Чен, рекламные системы изначально не случайны:

«Ключевой момент заключается в том, что реклама, которую видит человек, не случайна. Общая картина рекламы может нести сигналы о таких характеристиках, как пол, возраст, образование, статус занятости, политические предпочтения и более широкое социально-экономическое положение. Наше исследование показывает, что ИИ могут анализировать эти закономерности и делать выводы о личных характеристиках на основе одной лишь рекламы».

Системная уязвимость

Авторы подчеркивают, что речь идет не о гипотезе, а о воспроизводимом механизме. Потоки рекламы фактически работают как цифровой отпечаток пользователя, который можно анализировать вне платформы. Эти результаты впервые предоставляют эмпирические доказательства того, что рекламные потоки служат высокоточным цифровым следом, подчеркивая системную уязвимость в рекламной экосистеме

Отдельно отмечается риск расширений браузеров, которые имеют доступ к содержимому страниц:

«Мы определили расширения для браузеров, злоупотребляющие законными привилегиями, как потенциальный основной вектор этой атаки»

Почему это нельзя игнорировать

Даже при ограничениях со стороны платформ реклама все равно косвенно «выдает» особенности пользователей. Из отдельных объявлений и их набора можно восстановить личные характеристики, даже не имея прямого доступа к данным человека.

По мнению исследователей, решить эту проблему только техническими средствами не получится. Нужны и правила на уровне регулирования, потому что полностью убрать этот риск со стороны пользователя нельзя — он заложен в самой системе онлайн-рекламы.

Naukatv.ru: последние новости

Нейробиологи показали, как мозг реагирует на просмотр сериалов

Почему современные здания, интерьеры и экраны перегружают наш мозг: ученые

Китай впервые посадил ступень ракеты по новой технологии: видео

Наука и техника

Сидней