Браузерный отпечаток — это систематический сбор информации с удалённого устройства с целью уникального выявления и отслеживания пользователя. Основная мотивация этой техники — монетизация пользовательских данных, часто для персонализированных рекламных кампаний и профилирования пользователей.
В отличие от традиционных методов отслеживания, таких как cookie, отпечатки пальцев работают бесшумно и могут быть гораздо более устойчивыми. В технической литературе её описывают как «монстра без печенья», поскольку она не требует хранения файлов на устройстве пользователя и полностью прозрачна для пользователя.
| Функциональные | файлы cookie | Браузер с отпечатками |
|---|---|---|
| Хранение | Хранит небольшие файлы на компьютере пользователя. | На компьютере пользователя («без cookie») файлы не хранятся. |
| Видимость и контроль пользователей | Пользователь может просматривать, блокировать или удалять через настройки браузера. | Работает прозрачно. Пользователь не может напрямую знать, что это происходит, или предотвратить это. |
| Настойчивость | Пользователь может удалить. | Очень настойчиво. Он даже может использоваться для восстановления удаленных пользователей файлов cookie, вновь связывая его личность. |
Теперь, когда мы понимаем, что такое браузерный отпечаток и почему он более устойчив, чем куки, давайте рассмотрим конкретные методы, используемые для создания этих уникальных цифровых идентификаторов.
Уникальность отпечатка пальца заключается в сочетании множества различных элементов информации, некоторые из которых являются простыми характеристиками браузера, а другие — высокоразвитыми и сложными.
Это базовые характеристики, которые можно собрать через браузер для начала создания профиля. Каждая информация, в сочетании с другими, помогает сузить круг идентификации устройства.
Эти методы используют современные веб-технологии для извлечения тонких, но сильно идентифицирующих деталей с устройства.
Эта техника использует элемент HTML5 Canvas для рисования скрытого изображения или текста. Поскольку каждое устройство отображает его немного по-разному из-за различий в видеокарте, драйверах и операционной системе, полученные данные изображения можно преобразовать в хэш (уникальную строку символов), которая служит мощным идентификатором.
Это разновидность Canvas fingerprinting, этот метод генерирует изображения одной и той же текстовой строки несколько раз, каждый с разным шрифтом из заранее определённого списка. Тонкие различия в рендеринге между разнообразными шрифтами позволяют извлекать метрики из сгенерированных изображений, создавая уникальный идентификатор для браузера.
Эта техника использует API WebRTC (технология связи в реальном времени) для обнаружения истинного локального IP-адреса устройства, даже если оно находится за маршрутизатором Network Address Translation (NAT). Объединение этого локального IP с публичным IP-адресом создаёт очень стабильный и последовательный фактор идентификации.
Этот метод использует API AudioContext для обработки стандартного компьютерно сгенерированного аудиосигнала (подобного синусоиды). Он не слушает микрофон устройства. Итоговый обработанный аудиосигнал имеет тонкие вариации благодаря уникальному аппаратному и программному стеку устройства. Этот выход затем хешируется для создания уникального идентификатора.
| Техника | Как она работает (упрощённо) Почему | она эффективна для идентификации |
|---|---|---|
| Холст | Рисует скрытое изображение и анализирует тонкие различия в рендеринге между устройствами. | Различия в графическом оборудовании, драйверах и шрифтах делают итоговое изображение уникальным для устройства. |
| Холстовый шрифт | Рендерит один и тот же текст с множеством разных шрифтов для измерения несоответствий рендеринга. | Конкретное сочетание установленных шрифтов и их рендеринга создаёт крайне уникальный профиль. |
| WebRTC | Использует коммуникационный API для выявления локального IP-адреса устройства. | Объединение локальных и публичных IP-адресов позволяет уникально идентифицировать устройство в сети. |
| АудиоКонтекст | Обрабатывает стандартный аудиосигнал для обнаружения различий в аудиостеке устройства. | Аппаратное и программное обеспечение обработки звука на каждом устройстве дают немного разный выход. |
Хотя каждая из этих техник собирает часть головоломки, настоящая сила отпечатков пальцев заключается в их комбинировании; В следующем разделе объясняется, как мы можем научно измерить эту способность идентифицировать.
Научный способ измерения уровня уникальной идентификации, предоставляемой информацией, называется информационной энтропией, которая измеряется в «битах». Более высокая энтропия означает больше уникальности.
Простая аналогия — шестигранный кубик. Один бросок имеет шесть возможных исходов, что даёт около 2,58 бита информации. Если у события было всего два исхода (например, подбрасывание монеты), оно предоставило бы только 1 бит информации. Чем больше возможных исходов, тем выше энтропия и тем больше «информации» даёт результат.
Когда сайт собирает характеристики браузера, это снижает неопределённость (энтропию) относительно того, кто вы есть. По оценкам, для уникальной идентификации одного человека из мирового населения в 7,5 миллиарда потребуется примерно 33 бита энтропии .
Исследовательский проект Panopticlick наглядно показывает, как различные атрибуты браузера вносят элементы идентифицирующей информации.
Пример: Части идентифицирующей информации
| Характеристики браузера | , значимость идентифицирующей информации | для идентификации |
|---|---|---|
| Детали плагинов браузера | 9.14 бит | Более высокое значение означает, что эта характеристика реже и делает вас уникальной. |
| Пользовательский агент | 7,68 бит | Такое сочетание браузера и ОС довольно редко, что добавляет значительную идентифицирующую силу. |
| Хэш отпечатка холста | 6,62 бита | То, как ваше устройство отображает графику, — это сильный показатель. |
| Системные шрифты | 6,5 бита | Конкретный список шрифтов на вашем компьютере очень отличается. |
| Часовой пояс | 2,7 бита | Хотя он не уникален сам по себе, он помогает значительно сузить круг возможностей. |
В тесте Panopticlick сочетание этих и других значений дало в общей сложности не менее 20,37 бита идентифицирующей информации, что делает браузер уникальным среди более чем 1 357 000 других тестируемых объектов. Похожий проект AmIUnique.org также демонстрирует это, показывая пользователям, как их отпечаток браузера сравнивается с большой базой данных других, часто находя его уникальным.
Понимая, что отпечатки пальцев — это измеримая наука по снижению анонимности, мы теперь можем оценивать стратегии защиты от неё.
Самый важный принцип защиты для пользователей прост: чем ближе устройство к общей или стандартной конфигурации, тем сложнее его уникально идентифицировать.
Многие распространённые инструменты конфиденциальности неэффективны против сложного отпечатка пальцев.
Исследование, анализирующее эффективность различных мер смягчения последствий, выявило явного победителя.
Другие потенциально эффективные, хотя иногда и непрактичные, меры включают:
Учитывая эти защитные стратегии, давайте кратко изложим самые важные моменты из этих заметок.