Аналитика прослушиваний по IAB
📝

Аналитика прослушиваний по IAB

Прослушивание — это ключевая метрика для аналитики подкаста.

Платформы, предоставляющие аналитику по подкасту, могут считать их по-разному. К примеру, кто-то считает прослушиванием любой запуск дорожки, даже если пользователь слушал ее пару секунд, другие — если прослушано более половины, третьи — считают два, три или четыре прослушивания, если слушатель несколько раз ставил подкаст на паузу, а потом возвращался.

Стандарты делают правила игры для всех равными.

Что такое аналитика по IAB и что там за стандарты?

IAB (The Interactive Advertising Bureau) — это международная ассоциация развития интерактивной рекламы. У IAB есть гайдлайн, регулирующий правила измерения показателей в подкастах.

IAB разработали стандарт, который регулирует возможные неточности в подсчете прослушиваний, а платформы, соблюдающие его, обеспечивают подкастерам и рекламодателям доступ к одинаково измеримой реальной статистике и показателям подкаста.

💙
Команда mave входит в рабочую группу IAB Russia по подкастам, поэтому мы собираем аналитику, которая отвечает всем стандартам ассоциации.

Основное, что надо знать об аналитике прослушиваний по IABv2.0 и как она касается твоей статистики

  1. Фильтруем запросы
  2. Чаще всего не проходят фильтр запросы от подозрительных User-Agent или IP. Такие адреса либо не принадлежат реальным пользователям (сервера), либо находятся в черных списках. Эти запросы мы не учитываем в аналитике.

    Подробнее

    Исключаем запросы на предзагрузку

    Предзагрузка подкастов напрямую влияет на количество прослушиваний (скачиваний) подкаста, хотя это некорректно. Это контролируется двумя способами:

    • Запрет на предзагрузку в плеерах и на сайтах.
    • Использование пороговой логики для загрузки, основанной на подгрузке ID3 и 1 минуты дорожки, чтобы дает возможность определить, что запрос действительно был на прослушивание/скачивание, а не на предзагрузку файла.

    Исключаем потенциальных ботов и фейковые (ложные) запросы

    Существует много сценариев, когда исходные запросы включают запросы, которые не должны учитываться в статистике, так как с большой вероятностью они идут от ботов или сервисов, которые могут выглядеть, как реальные прослушивания/скачивания. Что не проходит фильтр:

    • IP адреса, не принадлежащие реальным пользователям (к примеру, известным серверам);
    • IP адреса, которые инициируют большие объемы скачиваний/обращений к хостингу, они должны проверяться на потенциальные мошенничества;
    • IP адреса, принадлежащие серверам вроде AWS;
    • ошибочные refferer данные;
    • ложные UA, прим. Firefox 3.06;
    • User Agents, которые идентифицируются не принадлежащими реальным пользователям (прим. боты, которые сами себя определяют ботами);
    • refferer данные, которые подразумеваются, как источники, не являющиеся реальными пользователями;
    • Apple клиенты – официальное приложение Apple Podcasts делают запросы объемом в 2 байта. Эти запросы делает Apple, чтобы убедиться, что файл можно скачать.

    Отслеживаем и фильтруем HTTP запросы

    • HEAD запросы потому что обычно используются с целью проверки на изменения, так как никакие данные через HEAD запрос не передаются.
    • Определенные GET запросы  206 (partial request) в случае, если загрузка файла не отвечает правилу 1 минуты.
  3. Анализируем объем скачиваемого файла
  4. Фиксируем объем подгрузки дорожки выпуска. Это важно, потому что пользователь может загрузить всего несколько секунд контента или только метаданные (ID3-тег), а еще это может быть бот — такое прослушивание учитываться не будет. Начинаем считать скачивание за прослушивание после подгрузки контента на 60 секунд или 100%, если дорожка короче минуты.

    Подробнее

    Пороговая логика

    Загрузки менее определенного размера вряд ли приведут к реальному потреблению, так как была получена слишком маленькая часть файла для прослушивания контента. Следующие правила помогают исключить скачивания, которые слишком малы, чтобы их можно было засчитать за действительные:

    • должен быть загружен тег ID3 и контент, достаточный для воспроизведения в течение 1 минуты или 100% файла, если он менее минуты;
    • установленный размер ID3 тега — так как размер файла ID3 может значительно различаться, то mave измерять размер файла тега ID3 для каждого подкаста.
    ☝🏻
    Что это значит Может быть такое, что после импорта подкаста в mave с платформы, где прослушивания учитывались по-другому, твоя статистика может немного упасть. Но это же хорошо, ведь лучше горькая правда.
  5. Фиксируем уникальные прослушивания и слушателей
  6. Мы отслеживаем уникальные прослушивания через два параметра — User-Agent и IP адрес, в них хранится информация об устройстве и пользователе, что дает нам возможность идентифицировать одного и того же пользователя, не нарушая анонимность персональных данных. Так определяем: повторное это прослушивание или выпуск слушает совсем другой человек.

  7. Считаем прослушивания в рамках окна в 24 часа
  8. Если один пользователь обращается к файлу выпуска несколько раз в рамках 24 часов, то это считается одним прослушиванием, как только 24 часа после первого запроса проходят, то следующее обращение к файлу (с учетом всех предыдущих фильтров) считается новым прослушиванием.

☝🏻
Кстати, с сентября 2020 года в аналитике по IAB больше не учитываются прослушивания с Apple Watch. Раз нельзя, то нельзя. Почитать тут

Резюмируя, статистика по IAB показывает максимально чистые и релевантные действительности данные по твоему подкасту. Если при переносе подкаста в mave ты видишь, что статистика стала хуже — не пугайся, твоя аудитория на месте, просто теперь ты видишь все цифры с минимальной погрешностью.

Что считается прослушиванием в статистике mave

Уникальным прослушиванием в mave считается:

  • Загрузка дорожки выпуска реальным пользователем, а не ботом или запрос сервера.
  • Загрузка дорожки выпуска на 60 секунд или полная загрузка файла (100%), если выпуск менее минуты.
  • Все обращения к файлу уникального пользователя в рамках 24-часового окна, то есть если один пользователь слушает выпуск несколько раз в сутки, это будет учитываться одним прослушиванием. Если этот же пользователь обратится к файлу после 24-часов с последнего обращения — это будет считаться новым прослушиванием.

Читать дальше:

📝
Какие данные мы не учитываем
📢
Что-то упустили? Можно написать нам в чатик или на help@mave.digital — все разрулим✌️

Обновлено 30.10.2020