Люди против cookies. Как правильно измерять онлайн-аудиторию?
depositphotos Данных о пользователях сейчас очень много, технологии их обработки и анализа постоянно совершенствуются, но ситуация с медиаизмерениями оставляет желать лучшего. Покупатели данных жалуются на то, что существующие системы измерения онлайн-аудитории не являются достаточно прозрачными и унифицированными, что интернет остается самым плохо измеряемым медиа. В первые десятилетия поставщики данных довольствовались cookies, но развитие технологий и проникновение мобильных устройств бросили вызов рынку. В последнее время стало модно «хоронить» cookies. Во-первых, браузеры с антивирусными программами научились запрещать отслеживание cookies. На защиту персональных данных встали и власти. Среди последних инициатив подобного рода — Intelligent Tracking Prevention (ITP) в браузере Safari и Общий регламент по защите данных (General Data Protection Regulation), принятый в Евросоюзе. GDPR ужесточил требования к условиям получения согласия на обработку данных — запрос должен подаваться в понятной и легкодоступной форме, вместе с прилагаемым к этому согласию разъяснением цели. С 25 мая 2018 года компании больше не смогут использовать длинные неудобочитаемые положения и условия, полные специальных юридических терминов. Во-вторых, изменение привычек медиапотребления породило понятие кросс-платформенности. Аудитория быстро переключились с телевидения и ПК на мобильные устройства. Рекламная платформа Atlas, приобретенная Марком Цукербергом в 2013 году, как раз работала принципиально по-иному: кроссплатформенное измерение было основано на Facebook ID. Это позволяло отслеживать конкретного пользователя, какое бы устройство или браузер он не выбрал. Медиаиндустрии понадобилось некоторое время, чтобы идею приняли на вооружение в отрасли. Использовать собственные данные для измерений онлайн-аудитории научились владельцы самых популярных социальных платформ. Например, Mail.Ru Group в myTarget учитывает как ID устройств Android и iOS, так и ID пользователей соцсетей «Одноклассники», «ВКонтакте», «Мой мир». Как же сейчас измеряют аудиторию сайтов в Рунете? Счетчики По данным W3Techs, лидером среди сервисов веб-статистики в мире является Google Analytics — на данный момент его используют 57% сайтов, а рыночная доля инструмента составляет 86%. На втором месте «Яндекс.Метрика» (5,5%, 8,2%), на третьем WordPress Jetpack (4,7% и 7,1%), на четвертом LiveInternet (2,9% и 4,3%), а замыкает первую пятерку Hotjar (2,1% и 3,2%). Треть площадок вообще не использует инструменты для анализа трафика. Самыми быстрорастущими сервисами по итогам 2017 года стали WordPress Jetpack, «Яндекс.Метрика» и Heap. Глобальное лидерство Google Analytics подтверждается и другими аналитическими сервисами. Statista со ссылкой на Ghostery и Cliqz сообщает, что Google отслеживает почти 65% всех загрузок веб-страниц. По этому показателю компания опережает Facebook (29%), comScore (12%), Twitter (11%), Amazon (10,5%), «Яндекс» (8%), Criteo (6,5%), New Relic (6%), Quantcast (6%), LiveInternet (5,5%) и AppNexus (5,5%). По версии G2 Crowd, лучшие позиции (по уровню доверия и присутствию на рынке) занимают Google Analytics, Google Analytics 360 и Google Tag Manager. Согласно данным RUWARD, рейтинг счетчиков и систем веб-аналитики 2018 в России возглавляет «Яндекс.Метрика». Она установлена на 40% сайтов Рунета. LiveInternet Он был создан в 2003 году путем объединения счетчика rax.ru и платформы li.ru и долгое время был ориентиром для Рунета. Однако конкуренция и громкие скандалы сделали свое дело: сегодня сервис Германа Клименко участники рынка считают морально устаревшим. Счетчик дает представление о просмотрах, посетителях, сессиях, хостах, перезагрузках, средней длительности сессий и просмотров, источниках трафика, демографических характеристиках аудитории, ее географии, используемых пользователем языке, ОС, браузере и провайдере. Счетчик LiveInternet учитывает посещаемость только тех страниц сайта, на которых он установлен и только того сайта, для которого он зарегистрирован. Для более полной статистики необходимо вставлять html-код счетчика на все страницы сайта и указывать дополнительные адреса (зеркала, aliases). LiveInternet серьезно сдал позиции в 2013 году, когда крупные площадки стали отказываться от использования счетчика. Сайты сетовали на ограниченный функционал и неэтичное поведение сервиса. Поводом для таких обвинений стало выступление Германа Клименко на форуме FinNext, где он рассказывал о скоринговом сервисе Fastscoring. Общественность возмутило то, что проект использует информацию о поведении пользователя, собранную на сайтах с установленным счетчиком LiveInternet — а таких насчитывается 1,4 млн. Изменение привычек, стоп-факторы (болезнь, налоговые претензии) и другие критерии (порнография, азартные игры) — все это могло повлиять на решение о выдаче кредите. На резонный вопрос о законности Клименко заявил: «У меня нет персональных данных. Ваши юристы должны на эти вопросы отвечать — не я. То, что собираю я, не нарушает никоим образом законодательство». В прошлом году LiveInternet изменил методику учета входящего трафика, что сразу отразилось в отчетах: снизилось количество переходов, упала глубина и длительность сессий. Как отметили в медиапроектах Mail.Ru Group, теперь данные Liveinternet стали ближе к реальности. «Яндекс.Метрика» Проект постоянно развивается, в 2018 году он обещает добавить еще больше срезов. Так, в начале года сервис начал предоставлять отчёты по десктопным и мобильным операционным системам и по разным типам устройств — смартфонам, планшетам и десктопу. Сам владелец «Яндекс.Метрики» позиционирует ее как ведущую систему веб-аналитики в России, которая работает с 2009 года. По состоянию на июнь 2017 года, «Яндекс.Метрика» регистрирует 78,3% трафика в доменной зоне .ru. Сервис измеряет аудиторию при помощи счетчика — кода (JavaScript и HTML), включаемого в содержимое веб-страниц. Какие данные собирает счетчик «Яндекс.Метрики»? URL, реферер и заголовок страницы, сведения о браузере, операционной системе, типе устройства, размерах экрана, версиях Flash и Silverlight, наличии Java, JavaScript, cookies, часовом поясе, поле и возрасте, интересах посетителя, географические данные, параметры загрузки страницы, а также время на сайте и глубину просмотра. «Яндекс.Метрика» автоматически присваивает ClientID каждому уникальному посетителю сайта. Анонимный идентификатор создается случайным образом и определяет браузер, в котором посетитель просматривает сайт. Таким образом, если посетитель просматривал сайт из двух разных браузеров, в «Яндекс.Метрике» будет зафиксировано два разных ClientID. Решить проблему сервис планирует за счет кросс-девайсного отчета, который пока работает в режиме бета-тестирования. В отличие от других отчетов «Метрики» здесь посетитель не равен браузеру, а учитывается на всех его устройствах и браузерах. Поэтому количество посетителей подсчитывается точнее — и при прочих равных будет меньше, чем в других отчетах. Виктор Тарнавский, руководитель аналитических продуктов «Яндекса»: Мы видим объективную картину: «Яндекс.Метрика» стоит на топовых ресурсах в разных категориях. Подсчет пользователей на данный момент реализован по классической схеме, которая применяется в большинстве сервисов веб-аналитики: посетители учитываются по уникальным браузерам. Исключение — отчёт «Кросс-девайс»: в нем все устройства и браузеры одного посетителя связаны между собой с помощью технологии «Крипта», которая применяется в самых разных продуктах «Яндекса». Мы думаем над тем, чтобы полностью перейти на кросс-девайсную схему учёта посетителей и сделать оценку посещаемости сайта еще более точной. Google Analytics Главное отличие «Яндекс.Метрики» от «Яндекс.Метрики» — большее количество режимов, настроек и фильтров, более сложный интерфейс. Среди предоставляемых данных — стандартные показатели: демографический состав аудитории (пол/возраст), ее местоположение и язык, интересы пользователей, технологии (браузер, ОС, сеть). Более детальный портрет аудитории можно составить, используя функцию «Активные пользователи» — она позволяет отслеживать, как меняется активность пользователей на сайте или в приложении с периодичностью в 1, 7, 14 и 30 дней. «Когортный анализ» помогает выделить и проанализировать поведение когорт — групп пользователей, имеющих общее свойство. С помощью отчета «Статистика по пользователям» можно просматривать и анализировать поведение отдельных пользователей на основе идентификаторов Client-ID или User-ID — в отличие от сводных данных. Отчет о поведении («Новые и вернувшиеся», «Периодичность и время с последнего посещения», «Вовлечение») дает возможность оценить привлекательность сайта. Антон Сучков, директор по цифровой стратегии и коммуникациям Rambler Group, владельца крупных медиаресурсов в Рунете — Ленты.ру, Рамблера, Афиши, Газеты.ру и др.: Мы используем общепринятые на рынке измерители (Mediascope, Google Analytics, «Яндекс.Метрика»), а также собираем данные своих проектов, производим собственные измерения аудитории для более глубокого понимания ее поведения. Продолжает развиваться наш счетчик «Рамблер/Топ 100». Конечно же, нам, как площадкам, кажется, что нас где-то «недосчитывают», где-то, как в случае с Mediascope, нам бы хотелось большей полноты данных и прозрачности результатов, но эти вопросы всегда «висят» в воздухе, а решение — где-то посередине. Если и площадки, и рекламодатели будут смотреть на несколько источников данных и будут уметь их правильно читать, понимая специфику каждого из них, то поиски уникального решения, которое устроит всех участников рынка, останутся в прошлом. Данных по измерениям сейчас очень много — вопрос в уровне прочтения и их дальнейшей интерпретации. Панельные исследования Mediascope Ранее медиа-исследовательское подразделение группы TNS Россия. Национальный медиаизмеритель в России, на чьи данные ориентируются медиаплощадки и рекламодатели. Информацию об объемах, профиле и других характеристиках интернет-аудитории в России поставляет в рамках проекта WEB-Index, запущенного в 2007 Исследование репрезентирует население России в возрасте 12−64 лет. По соглашению с индустрией на старте проекта измерялось домашнее и офисное использование интернета на стационарных компьютерах и ноутбуках. Сейчас десктопная панель охватывает более 50 тысяч человек: 1.12,5 тысяч — за счет site-centric панели, когда на компьютеры пользователей не устанавливается никакого программного обеспечения, регистрация заходов на сайты происходит при помощи кук и счетчиков, установленных на сайтах, 2 40 тысяч — за счет user-centric панели, на устройствах участников которой установлено специализированное измерительное ПО, фиксирующее всю активность пользователей в браузере. Сайтам-участникам исследования дополнительно предоставляются данные счетчика: число уникальных посетителей (Unique Visitors) и количество просмотров страниц сайта (Hits). Для измерения объема и структуры интернет-аудитории в целом (без разбивки на сайты) Mediascope проводит собственное установочное исследование — по телефону в ежедневном режиме. В 2014 году дополнительно к стационарным компьютерам и ноутбукам в измерение были включены мобильные устройства (смартфоны и планшеты). Мобильное измерение осуществляются на панели в 5 тысяч человек. При этом у одних и тех же панелистов фиксируется как активность со стационарных компьютеров, так и с мобильных устройств. Построенная single-source desktop+mobile панель позволяет измерять пересечение аудитории проектов на разных платформах и предоставлять данные по совокупной аудитории на десктопе и в мобайле. Все заходы панелистов на измеряемые сайты и приложения как на десктопных, так и на мобильных устройствах регистрируются автоматически. Главным преимуществом методики WEB-Index является оценка аудитории в людях, а не в уникальных пользователях (или устройствах). Собираемые таким образом данные позволяют проводить сравнение аудитории Интернета и традиционных медиа (ТВ, радио, прессы). Инесса Ишунькина, директор по интернет-исследованиям Mediascope: Данные проекта WEB-Index дают понимание того, какое число реальных людей пользуется различными интернет-ресурсами, каков социально-демографический профиль этих людей и с каких устройств они потребляют контент. Методика сбора информации уникальна для нашей страны, мы — единственная исследовательская компания в России, которая собирает информацию по пользованию различными площадками как на десктопных, так и на мобильных устройствах на единой панели. Площадки, получающие эту информацию, могут сравнить ее с данными счетчика и понять реальную картину пользователей. Данных счетчика чаще всего бывает недостаточно, поскольку рост площадки по данным счетчика может быть связан не с ростом ее аудитории, а с ростом кук в Рунете. Так, выход новых версий браузеров или операционных систем традиционно провоцирует заметный рост количества кук, которых сейчас мы фиксируем уже более 1 млрд ежемесячно. Всего на одного реального пользователя приходится порядка 21 уникального посетителя за месяц. Ограничением проекта является число панелистов, позволяющее измерять аудиторию площадок с посещаемостью более 10 тысяч уникальных посетителей в день, а также отсутствие данных о мобильной аудитории в городах с населением менее 100 тысяч человек. Алексей Смирнов, руководитель Annalect (входит в состав OMD OM Group, крупнейшей в России группы по закупкам рекламы в интернете, по оценке АКАР и Sostav): Фактически независимый измеритель у нас в интернете один. Нельзя сказать, что всем участникам рынка это нравится. Очевидно, что нынешнее разнообразие инструментов размещения не может быть оценено с помощью текущей системы аудиторных измерений. Рынку сильно не хватает альтернативы. Причем не только альтернативного измерителя, но и альтернативных подходов. Кросс-платформенность и прозрачность пока являются скорее мечтами, чем практикой. Монополия Mediascope сложилась после ухода с российского рынка главного конкурента — американской СomScore. Компания, специализирующаяся на измерениях аудитории в интернете и цифровых медиа, с января 2018 года прекратила заниматься исследованиями Рунета. Управляющий директор российского офиса СomScore Роман Исаев объяснил решение тем, что бизнес в России был признан бесперспективным с точки зрения развития и получения выручки, адекватной ожиданиям компании. Кроме того, исследовательская компания Gemius свернула аудиторные измерения в России. Однако панель осталась, и при наличии спроса измерения можно возобновить, говорят в компании. Вместо этого Gemius проводит аудит рекламных диджитал-кампаний и мониторинг интернет-рекламы. Эмин Алиев, управляющий директор компании « Criteo Россия»: Учесть кросс-платформенность в измерениях могут только те компании, у кого есть соответствующие инструменты. Под этот критерий подходят крупнейшие игроки рынка: Яндекс, Mail.ru Group, Google, Criteo. Существующие технологии позволяют определять одного и того же пользователя на разных устройствах, соответственно, измерять онлайн-аудиторию все вышеперечисленные компании научились довольно точно. Итоги Счетчики имеют значительно бОльший охват, поэтому у результатов по счетчику отсутствует ошибка выборки. Однако они считают аудиторию не в людях, а в количестве устройств, что зачастую приводит к завышению показателей площадки. В то же время панели ограничены количеством участников: чем меньше аудитория сайта/раздела/отдельной страницы, тем менее вероятно получить статистически значимые оценки их аудитории. Кроме того, панели имеют ограничение по возрасту и географии измерения. Существующие сегодня системы измерения онлайн-аудитории во многом не удовлетворяют участников рынка. Запросы меняются гораздо быстрей, чем измерители успевает их «переваривать». Потребители данных ждут появления альтернативы и надеются на повышение прозрачности данных. Пока же одновременное использование и сочетание нескольких систем измерений — обычная практика для медиаотрасли.