Кто смотрит кто? Netflix и ваши данные
Сегодня Netflix используют более 167 миллионов человек по всему миру. Это бесчисленное количество часов потокового контента каждый день на разных платформах и устройствах. Поскольку наша жизнь все больше зависит от технологий, мы подвергаемся большему риску взлома или взлома наших данных. За первые 6 месяцев 2019 года было взломано более 4,1 миллиарда личных записей. Ожидается, что это число будет только расти по мере того, как киберпреступности станут более совершенными, в то время как группы по кибербезопасности играют в догонялки, пытаясь защитить пользователей.
По данным Business of Apps , в Великобритании в среднем 18-34 года ежедневно наблюдают за Netflix более часа, показывая, как часто мы разрешаем таким компаниям доступ к нашим устройствам и данным. Мы хотели пролить свет на то, как этот развлекательный гигант хранит наши данные и различные точки, которые они отслеживают на нас.
Чтобы добиться этого, мы извлекли данные Netflix из 5 тысячелетий, которые являются заядлыми пользователями потокового сервиса, чтобы выяснить, какие именно данные Netflix отслеживает у пользователей. Для сбора данных iPhone Backup Extractor использовался для извлечения необработанных данных, хранящихся в приложении Netflix, на мобильном устройстве каждого пользователя.
Команда Reincubate обработала необработанные данные для каждого пользователя, что дало представление о том, как Netflix может создать картину каждого отдельного пользователя. Используя только данные, хранящиеся в Netflix, была обнаружена следующая информация об одном пользователе, Серена:
- Любимый жанр Серены - Sci-Fi.
- В то же время, похоже, что Серене также нравится Glee. Всего она просмотрела 62 эпизода: 57 из них были просмотрены на всем протяжении, а 5 не были закончены.
- Серена также посмотрела 34 эпизода «Доброй ведьмы», 50 эпизодов «Хорошего места» и 51 эпизод «Великого британского испечь».
- Серена смотрела 181,76 часа Netflix на своем iPhone. Это более 7 с половиной дней.
- Она имеет 16 автономных загрузок и наблюдает за Netflix на 3 разных устройствах.
- Серена, вероятно, будет смотреть что-то до завершения 76% времени.
- Она обычно делает 88% прогресса в среднем за каждую сессию и наблюдала 220 фликсов * до конца.
* flix: телевизионная программа или фильм, доступные на Netflix
После показа этих результатов, 21-летняя Серена прокомментировала: «Я была удивлена, что провела так много времени на Netflix - я понятия не имела, что потратила более 181 часа на просмотр Netflix. Я немного неохотно передавал свои данные, но чем больше я думал об этом, тем больше это имело смысл. Все эти компании имеют мои данные, так почему я не могу? Я никогда не был человеком, который читает политику конфиденциальности, я просто всегда нажимаю «Принять», но я знаю, что определенно буду уделять гораздо больше внимания, просто чтобы точно знать, какие данные они хранят на мне ».
Эти данные были извлечены с помощью iPhone Backup Extractor. Любой пользователь iPhone может проверить содержимое резервной копии со своего телефона, чтобы получить доступ к информации, хранящейся в компаниях, о своих личных данных и привычках, восстановить удаленные текстовые сообщения и многое другое.
Наш эксперимент показывает, что Netflix хранит ряд данных о пользователях и поведении в приложении, которые пользователи могут не учитывать; от среднего времени, потраченного на просмотр, до просмотра пользователями фильма или эпизода.
Мы обнаружили, что Netflix отслеживает следующие данные пользователя
- Самые популярные категории
- Самые популярные списки
- Общее количество часов, проведенных за просмотром Netflix
- Количество минут, потраченных на просмотр каждого фильма
- Заголовок, эпизод, описание и тип просматриваемого контента (фильма или эпизода)
- Дата последнего просмотра
- Фликс завершен и незакончен
- Является ли пользователь владельцем учетной записи Netflix
- Был ли фильм смотреть на мобильном?
Итак, глядя на различные данные, которые мы смогли извлечь, как это соотносится с тем, что Netflix описывает в своей политике конфиденциальности? Политика конфиденциальности Netflix составляет около девяти страниц, поэтому легко понять, почему люди просто нажимают кнопку «Принять», не читая ее. В приведенной ниже таблице сравниваются различия между данными, которые мы можем извлечь из Netflix, и тем, что они обозначают в своей политике конфиденциальности:
Точка данных | Политика конфиденциальности Netflix | Извлеченные данные |
---|---|---|
Личные данные (например, имя, адрес, владелец аккаунта) | ✅ | ✅ |
Способ оплаты | ✅ | ❌ |
В некоторых странах мы собираем государственный идентификационный номер | ✅ | ❌ |
Выбор заголовков и просмотренных шоу | ✅ | ✅ |
Поисковые запросы | ✅ | ✅ |
Ваше взаимодействие с нашими [Netflix] электронными письмами, текстами и обслуживанием клиентов | ✅ | ❌ |
Сбрасываемые идентификаторы устройств (также называемые рекламными идентификаторами), например идентификаторы на мобильных устройствах, планшетах и устройствах потокового мультимедиа | ✅ | ❌ |
Характеристики устройства и программного обеспечения (такие как тип и конфигурация), информация о соединении, статистика по просмотрам страниц, ссылающийся источник (например, URL-адреса рефералов), IP-адрес (который может сообщить нам ваше общее местоположение), информация журнала браузера и стандартного веб-сервера | ✅ | ✅ |
Информация, собранная с помощью файлов cookie, веб-маяков и других технологий | ✅ | ❌ |
Другие компании, с которыми у вас есть отношения («Партнеры») | ✅ | ❌ |
Поисковые запросы и команды, применимые к Netflix, которые вы делаете через устройства Партнера или платформы голосового помощника | ✅ | ❌ |
Количество заряда батареи на мобильном устройстве | ❌ | ✅ |
Операционная система устройства | ✅ | ✅ |
категории | ✅ | ✅ |
Часы смотрели | ✅ | ✅ |
Фликс завершен / не завершен | ✅ | ✅ |
Дата и время просмотра | ✅ | ✅ |
Процент прогресса | ✅ | ✅ |
Смотрели ли вы фильм / эпизод на вашем устройстве | ✅ | ✅ |
Отметив точки данных, мы рассмотрели необработанные данные более подробно. Наше исследование показало, что в среднем мы заканчиваем 77% контента, который мы начинаем, только с 6% того, что мы смотрим в фильмах, по сравнению с 94%, которые являются эпизодами. Из данных также видно, что «Телепрограммы США», «Документальные фильмы» и «Экшн и приключения» являются тремя наиболее популярными категориями среди всех исследованных нами устройств.
Хотя Netflix заявил, что они ограничат количество раз, когда его подписчики могут делиться своими паролями с друзьями и семьей, исследование показало, что все пользователи делят свою учетную запись хотя бы с одним человеком, а 4 из 5 пользователей делятся своей учетной записью. с 4 или более пользователями.
Что касается времени, затрачиваемого на приложение, мы обнаружили, что в среднем пользователи проводят 58 часов за просмотром Netflix на смартфонах или других устройствах.
Когда я основал Reincubate в 2008 году, я хотел помочь пользователям получить доступ к данным, которые хранятся о них и их устройствах различными компаниями. По мере того, как технологии становятся все более изощренными, ценность защиты данных также возрастает. С более чем 160 миллионами потоковых подписчиков Netflix находится в уникальном положении. Они могут создать подробный профиль своих подписчиков, используя данные для определения поведения покупателей и их моделей покупок. Netflix объясняет, что потоковая передача в HD использует до 3 ГБ в час: это много данных, и у них есть много возможностей для сбора данных. Понимают ли пользователи, что отслеживается так много данных?
Тот факт, что пользователь наблюдает за Gossip Girl, не так уж и интересен, но когда, где и как он это смотрит, это напрямую связано с успехом потокового сервиса. На систему рекомендаций Netflix приходится более 80% контента, передаваемого на платформе, и наполнение этой системы поведенческими данными имеет решающее значение для их способности удерживать и развивать пользователей. Netflix также использует данные и аналитические инструменты, чтобы дать толчок для оригинального контента. Пользователи всегда должны быть осторожны, когда дело доходит до подписания Условий и положений, и в Reincubate мы рекомендуем всегда читать политику конфиденциальности, чтобы убедиться, что вы знаете, на что вы согласны. Мы надеемся, что этот проект поможет понять, как компании могут использовать эти соглашения для сбора пользовательских данных.