Какие данные собирают сайты в рекомендательных алгоритмах и почему это волнует власть
<p><strong>С октября 2023 года крупные онлайн-площадки в обязательном порядке начали раскрывать, как работают их алгоритмы рекомендаций. Теперь можно задаваться вопросом "Почему у меня это в ленте?" не риторически, а предметно, и по пунктам изучить, что влияет на рекомендованные товары на маркетплейсах или песни в VK или "Яндекс.Музыке".</strong></p> <p>"Фонтанка" узнала, какие данные интернет-пользователей интересуют российские компании и почему в правительстве потребовали эту информацию разглашать.</p> <p>В октябре VK, "Яндекс", Ozon, Wildberries, "Сбермаркет", "М.Видео-Эльдорадо", ivi и Start опубликовали на своих ресурсах правила применения своих рекомендательных алгоритмов — по требованию нового закона, вступившего в силу с начала октября. Он распространяется на соцсети, маркетплейсы и онлайн-кинотеатры. Теперь крупные онлайн-площадки должны объяснять, на основании чего у их пользователей составляется лента рекомендаций.</p> <p>Сами рекомендательные алгоритмы позволяют онлайн-сервису изменять список и порядок данных, выдаваемых конкретному пользователю в ответ на его запрос. Сейчас такими алгоритмами пользуются практически все сайты, начиная от поисковиков и заканчивая приложением какого-нибудь небольшого цветочного магазина. Как подчеркнули игроки рынка, это не сюжет очередной серии "Черного зеркала" — ваши данные и так собирают, а тут как бы вам на пользу, чтобы сервисом было удобнее пользоваться.</p> <p>"Фонтанка" ознакомилась со списком данных, которые компании используют для составления ленты рекомендаций. В большинстве своем пункты формальные и очевидные, вроде лайков и отметок "интересно" и "неинтересно", но есть и любопытные параметры, на которые почему-то обращают внимание компании.</p> <p>У "Яндекса" теперь появился раздел "Правила рекомендаций", где перечислены сведения для каждого из сервисов компании, от "Алисы" до "Яндекс.Музыки" и "Кинопоиска". Причем в списке четко прописано, что в компании "для борьбы с предвзятостью" используют специальные тесты и методики, чтобы гарантировать, что "алгоритм не дает несправедливого преимущества или дискриминации определенных групп или контента".</p> <p>Сам поисковик учитывает историю запросов пользователя, клики по ссылкам в результатах и время возврата на страницу поиска, информацию об устройстве пользователя, о его геолокации, cookie-файлы, язык запросов и страниц в результатах выдачи. В "Кинопоиске" на рекомендации влияет история поиска, оценки, которые пользователь ставит, и добавление фильмов в коллекцию.</p> <p>С "Яндекс.Go" интереснее. И такси, и доставка учитывают географию заказов и поездок, способы оплаты, местоположение пользователя и его предпочтения по тарифам. То есть, если часто заказывать "комфорт", то автоматически сразу будут предлагать "комфорт". Любопытнее то, что самокатчикам предлагают страховку. Да, если часто кататься на самокатах от "Яндекса", то сервис предложит "застраховать своё здоровье и здоровье окружающих, а также смартфон на случай, если он упадет во время поездки и повредится".</p> <p>В "Яндекс.Музыке" играют роль отметки "нравится" и настройки предпочтений. В их числе, например, настроение треков (бодрый он, веселый или грустный), степень знакомства с песней или исполнителем и сходство прослушанного с другим контентом. У "Алисы" в числе первых данных — возраст, видимо, чтобы колонка не сболтнула ребенку лишнего.</p> <p>Правила работы рекомендаций от VK больше напоминают какого-нибудь блогера, который просит ставить лайки и подписываться. "Чтобы было проще найти контент, который понравится именно вам, мы применяем рекомендательные технологии. Все ваши лайки, комментарии, репосты, просмотры — всё это учитывается при подборе видеороликов, которые мы вам предлагаем", — говорится в ролике VK. Отметки "Мне нравится", "Это не интересно", "Поделиться" и подписки влияют на факт и очередность показа контента едва ли не в первую очередь.</p> <p>Но есть и более любопытное. На ленту рекомендаций влияет и то, как часто пользователь оставляет комментарии, смотрит посты того или иного сообщества или пользователя, на кого подписывается и где проживает. А еще VK изучает, кого пользователи добавляют в друзья. Работает это, видимо, по принципу "скажи мне, кто твои друзья, а я скажу, какие у тебя рекомендации в VK".</p> <p>Ozon учитывает около 300 параметров: и товара, и пользователя, который эти товары просматривает. Влияют на показы той или иной продукции ее характеристики и рейтинг, а еще то, как долго покупатель просматривает товары, оформляет заказ или добавляет что-то в корзину. Wildberries тоже тщательно бдит, что его клиент делает на сайте, а заодно собирает информацию о его провайдере, браузере и операционной системе. А еще — разрешение и глубину цветности экрана на устройстве. Зачем — не уточняется.</p> <p>Онлайн-кинотеатр Start учитывает жанровые предпочтения пользователя, то, как часто он фильмы и сериалы смотрит и какие из них досматривает до конца. Ivi обращает внимание на покупки, добавление в избранное, просмотры и обратную связь от пользователя — активную или пассивную.</p> <h3>Нет ли здесь коммерческой тайны и не лукавят ли компании</h3> <p><br /> Большая часть правил работы рекомендательных алгоритмов от компаний довольно формальные — подробную цепочку "я зашел с этого браузера, лайкнул фото одноклассницы, послушал эту песню, поэтому у меня в рекомендациях вот это" составить не получится даже близко, потому что внутренняя кухня и сами формулы компании оставляют в секрете, объяснил "Фонтанке" генеральный директор диджитал-агентства Uplab Павел Тарелкин.</p> <p>Закон и не требует раскрытия коммерчески чувствительных нюансов работы, публикация правил работы алгоритмов, скорее, формирует доверительные отношения платформ с пользователями, рассказал гендиректор ассоциации "Интернет-видео" Алексей Бырдин. "При обсуждении законопроекта с ключевыми игроками интернет-рынка эти опасения были устранены как на уровне закона, так и подзаконных актов. Сегодня большинство сервисов уже разместили информацию о применении рекомендаций у себя на сайтах", — отметил он.</p> <p>Другой вопрос в том, что компании разместили. "Пока всё, что опубликовали площадки, — это абсолютно базовые вещи, общие слова. Самих алгоритмов здесь нет — только параметры. Очень всё кратко и неконкретно. Для чего — я не могу ответить на этот вопрос сам себе", — подчеркнул Павел Тарелкин.</p> <p>Грубо говоря, сейчас онлайн-площадки выложили на стол ингредиенты, но рецепта не дали. Есть параметры, а самое главное — что с этими параметрами делают и как и в каких пропорциях они влияют на ленту рекомендаций — ни одна из компаний не раскрывает.</p> <p>"Сказать, что пользователь что-то важное с законом получил, я не могу. Возможно, это сделано, чтобы в случае чего проверить (методы работы рекомендательных алгоритмов компании. — Прим. ред.), но я не думаю, что Роскомнадзор будет активно этим пользоваться, особенно с крупным бизнесом", — предположил Павел Тарелкин.</p> <h3>Не запрещаем, просто показываем</h3> <p><br /> Регулирование рекомендаций обсуждается с 2021 года. Депутатов, как вспоминают в одном из крупных интернет-агентств, всегда больше всего смущал антиправительственный контент, который мог попадать на основе рекомендательных алгоритмов в ленты пользователей. "Вспомните протесты 2021 года. Тогда вся лента ныне запрещенных сетей была в роликах с митингами — естественно, с внутренней кухней того, как это в ленты попадает, решили ознакомиться и этот процесс проконтролировать", — рассказали "Фонтанке".</p> <p>В одной из предварительных версий законопроекта предлагали обязать владельцев информационных ресурсов дать пользователям возможность отказаться от рекомендательных технологий — полностью или частично. Против этой инициативы выступали владельцы соцсетей и поисковых систем: в их числе и VK, и "Яндекс".</p> <p>"Если запретить рекомендательные алгоритмы, то это откатит все сервисы лет на двадцать назад. Нам просто неудобно будет ими пользоваться. Да и сбор данных будет осуществляться и без рекомендательных алгоритмов — для той же рекламы", — пояснил "Фонтанке" генеральный директор диджитал-агентства Uplab Павел Тарелкин.</p> <p>В итоге онлайн-площадки отделались малой кровью. В октябре внесли изменения в Федеральный закон "Об информации, информационных технологиях и о защите информации". Принятые поправки обязывают публиковать правила использования алгоритмизированных сведений. Они должны включать описание процессов и методов сбора данных, их систематизации и анализа, а также способов осуществления таких процессов и методов таргетирования запросов пользователей.</p> <p>"Основное требование нового закона — это прозрачность применения рекомендательных технологий. Владельцы сайтов и приложений, использующих механизм рекомендаций, теперь должны объяснять пользователю, по каким принципам он работает, какие данные собирает, как их обрабатывает. Всё это должно быть отражено в правилах, написанных простым и понятным русским языком", — рассказал "Фонтанке" автор законопроекта и член комитета по информационной политике Антон Горелкин.</p> <p>Теперь, если ресурс не информирует пользователей о том, по какому принципу работают их рекомендации, либо если эти технологии используются для распространения запрещенной информации, то в дело может вмешаться Роскомнадзор. То есть — потребовать доступ к программно-техническим средствам и проверить, как рекомендации работают.</p> <p>Если будут выявлены нарушения, то на их устранение владельцу дано десять дней. Иначе — сначала запрет на использование рекомендательных технологий, потом — блокировка. При этом новые требования не распространяются на государственные информационные системы и госорганы. Зато коснутся зарубежных, — это подтвердил "Фонтанке" и Антон Горелкин. Правда, подчинит ли себе Роскомнадзор Google или YouTube — большой вопрос, считают игроки рынка. Еще интереснее — не развяжут ли принятые изменения регулятору руки.</p> <p>"Закон обязателен к исполнению для всех сайтов и приложений, которые используют функционал рекомендаций. В том числе и зарубежных. Я уверен, что регулятор использует свои широкие полномочия таким образом, чтобы не допускать дисбаланса правоприменения в отношении российских платформ", — заверил "Фонтанку" Антон Горелкин.</p>