Хотя большинство пользователей интернета знакомы с файлами cookie, в интернете работает гораздо более устойчивый и невидимый метод отслеживания. Эта техника, известная как браузерное отпечаток, может создать уникальный профиль вас, не храня ничего на компьютере, что делает её крайне важной для любого человека, заботящегося о конфиденциальности.
Отпечаток на устройстве, более известный как браузерный дактилоскопинг, представляет собой систематический сбор информации из веб-браузера и устройства. Цель — объединить эти детали и создать идентификатор, достаточно уникальный для выделения, отслеживания и создания подробного профиля пользователя.
Эта техника была разработана как более устойчивый метод отслеживания, предназначенный для преодоления мер конфиденциальности, контролируемых пользователями, таких как удаление файлов cookie. В отличие от файлов cookie, которые пользователь может найти и удалить, отпечатки пальцев часто работают прозрачно, не сохраняя файлы на устройстве пользователя.
Методы цифрового отпечатка пальцев в специализированной литературе описываются как «монстры без печенья», поскольку для сбора информации на устройство не требуется устанавливать какой-либо файл cookie...
Эти «отпечатки пальцев» создаются путём объединения множества различных фрагментов информации, которые мы рассмотрим далее.
Основная идея браузерных отпечатков заключается в том, что хотя любая отдельная информация о вашем устройстве может быть обычной, сочетание многих таких деталей, скорее всего, будет уникальным. Сайт собирает набор этих характеристик, фактически создавая «цифровой отпечаток» для вашего браузера.
Вот некоторые распространённые характеристики, которые можно собрать для формирования базового отпечатка пальца:
Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:58.0) Gecko/20100101 Firefox/58.0).-120 минуты от UTC).1920x1080x24).Хотя эти базовые данные могут создать удивительно уникальный идентификатор, трекеры часто используют ещё более сложные методы для повышения точности.
Для создания более надёжных и точных отпечатков трекеров используют современные технологии, использующие современные функции веб-браузера.
Эта мощная техника использует элемент HTML5 Canvas — функцию, предназначенную для рисования графики и анимаций на веб-странице. Трекер инструктирует браузер нарисовать скрытое изображение или фрагмент текста. Уникальность заключается в том, что разные комбинации аппаратного обеспечения (например, графический процессор или GPU), программного обеспечения (драйверы графики) и операционных систем могут отображать это изображение немного по-разному. Конечное отрисованное изображение преобразуется в уникальную цифровую подпись, известную как хеш, которая служит высокостабильным идентификатором.
Это специализированная вариация канвалистов с отпечатками пальцев. Вместо того чтобы рисовать одно сложное изображение, он инструктует браузера отрисовывать одну и ту же строку текста несколько раз, каждый раз используя другой шрифт из установленного списка устройства. Измеряя тонкие различия в способе рисования каждого шрифта (его размер, сглаживание и т.д.), этот метод может создать идентификатор, очень специфичный для уникальной коллекции системных шрифтов пользователя.
WebRTC (Web Real-Time Communication) — это API, обеспечивающий прямую голосовую и видеосвязь между браузерами в реальном времени. Побочным эффектом этой функции является то, что WebRTC API может быть использован для выявления локального IP-адреса пользователя — адреса, который устройство использует в частной сети (например, домашней Wi-Fi), которая обычно скрыта. Объединяя скрытый локальный IP пользователя с его публичным IP, трекер может создать очень последовательный и эффективный идентификатор, даже если публичный IP меняется.
Эта техника использует AudioContext API — инструмент для обработки аудиосигналов внутри браузера. Важно отметить, что этот метод не слушает микрофон пользователя. Вместо этого он генерирует стандартизированную, неслышимую звуковую волну (похожую на синусусу) и обрабатывает её через аудиостек браузера. Полученный цифровой сигнал немного отличается на каждой машине из-за уникальных различий в аппаратных и программных драйверах. Хэш этого обработанного сигнала затем используется в качестве уникального идентификатора.
Теперь, когда мы понимаем, как создаются отпечатки пальцев, давайте посмотрим, как их уникальность измеряется научно.
Научный способ измерения уникальности отпечатка пальца — это информационная энтропия. Проще говоря, энтропия — это мера неопределённости, вычисляемая в «битах». Чем больше «идентифицирующих деталей» предоставляет характеристика, тем реже она встречается и тем лучше помогает уникально идентифицировать пользователя.
Например, знание того, что европейский пользователь пользуется Chrome (59% рынка в мае 2018 года), даёт очень мало идентифицирующей информации (около 1 бита). Однако знание того, что они используют Internet Explorer (4% доли рынка), даёт гораздо больше информации (около 4 бит), потому что это гораздо реже. Объединяя множество таких характеристик, суммарные биты энтропии могут быстро сложиться, создавая глобально уникальный идентификатор.
Следующая таблица, основанная на данных теста Panopticlick, показывает, как разные характеристики браузера вносят разные объёмы идентифицирующей информации.
Пример: Части идентифицирующей информации
данные| Характерные | для браузера идентифицирующие |
|---|---|
| Хэш отпечатка холста | 6.62 |
| Размер экрана и глубина цвета | 2.45 |
| Детали плагинов браузера | 9.14 |
| Часовой пояс | 2.70 |
| Системные шрифты | 6.50 |
| Платформа | 3.17 |
| Пользовательский агент | 7.68 |
Это измерение уникальности не только теоретическое; Это имеет значительные реальные применения и последствия.
В исследовании 2018 года Испанское агентство по защите данных (AEPD) проанализировало более 5 000 URL, чтобы понять распространённость этих методов. Результаты были показательными:
Исследование также подтвердило неэффективность сигнала «Не отслеживать» (DNT) — настройки браузера, которая просит сайты не отслеживать пользователя. Исследование показало, что сайты, использующие отпечатки пальцев, в подавляющем большинстве игнорируют этот запрос. В случае отпечатка на Canvas ошеломляющие 96,12% сайтов продолжали компилировать отпечаток даже после явной активации DNT. Более тревожно, что исследование показало, что сам сигнал DNT может использоваться как дополнительная точка данных, чтобы сделать отпечаток пользователя ещё более уникальным, превращая запрос на конфиденциальность в инструмент для идентификации.
При такой широкой и постоянной проблеме естественно спросить, что можно сделать для защиты личной жизни.
В исследовании AEPD были протестированы различные меры по снижению последствий, чтобы выяснить, насколько эффективно они могут предотвратить снятие отпечатков пальцев. Результаты явно различают пассивные функции конфиденциальности и активные инструменты блокировки.
| Метод: | Эффективность | метода (на основе исследования AEPD) |
|---|---|---|
| Приватный / Инкогнито режим | Удаляет локальную историю, файлы cookie и данные сайта после окончания сессии. | Неэффективно. Он не изменяет характеристики устройства, поэтому отпечаток пальца остаётся идентичным. |
| VPN / сети анонимизации | Скрывает публичный IP-адрес пользователя от сервера назначения. | Частично эффективно. Хотя они скрывают одну ключевую точку данных (публичный IP), они не фильтруют коллекцию других характеристик устройства. |
| Настройки конфиденциальности браузера (например, блокировка сторонних файлов cookie, включение DNT) | Использует встроенные настройки браузера для ограничения отслеживания. | Не значительное снижение. Исследование показало, что эти варианты мало влияют, за исключением заметного снижения обнаружения WebRTC. |
| Расширения браузера (блокирующие элементы, такие как uBlock Origin, Ghostery) | Активно выявляйте и блокируйте скрипты и соединения, известные как используемые для отслеживания. | Очень эффективно. Эти инструменты обеспечивали «значительное снижение обнаружения» в методах дактилоскопирования. |
| Отключение Javascript | Это предотвращает работу скриптов, собирающих данные отпечатков пальцев. | Эффективно, но непрактично. Этот метод нарушает функциональность многих современных сайтов, делая его нереалистичным решением для большинства пользователей. |
Эти выводы приводят к нескольким важным выводам для всех, кто обеспокоен своей цифровой приватностью.