Когда речь заходит о поведенческих факторах ранжирования, большинство специалистов вспоминает стандартный набор метрик: время на странице, глубину просмотра, показатель отказов и кликабельность в выдаче. Однако за этими привычными показателями скрывается более глубокий математический слой, который поисковые системы анализируют для оценки качества результатов. Одна из таких скрытых метрик - энтропия кликов.

Что скрывали поисковики

Долгие годы представители Google настаивали на том, что поведенческие сигналы не используются напрямую в ранжировании. Клики называли "слишком шумными данными", на которые нельзя полагаться при определении релевантности. Эта позиция выглядела логичной: пользователи ведут себя непредсказуемо, кликают по ошибке, поддаются на кликбейт.

Всё изменилось в ходе антимонопольного процесса Министерства юстиции США против Google в 2023-2024 годах. Судебные слушания вскрыли внутренние документы и презентации, которые рассказали совсем другую историю. Выяснилось, что система под названием NavBoost использует логи кликов для переранжирования результатов поиска уже много лет. Причём система различает "хорошие" и "плохие" клики, анализируя последующее поведение пользователя.

Оказалось, что заявления о неиспользовании поведенческих факторов были полуправдой. Google действительно не применял примитивную формулу "больше кликов - выше позиция". Вместо этого компания построила сложные системы машинного обучения, которые извлекают из поведенческих данных гораздо более тонкие сигналы. И один из таких сигналов связан с распределением кликов по результатам выдачи.

Математика неопределённости

Энтропия в теории информации измеряет степень неопределённости или хаоса в системе. Формула Шеннона, лежащая в основе этого понятия, подсчитывает среднее количество информации, содержащееся в сообщении. Применительно к поисковой выдаче энтропия кликов показывает, насколько предсказуемо пользователи выбирают результаты.

Представьте идеальную ситуацию: на запрос существует один очевидно лучший ответ, и все пользователи кликают именно по нему. Энтропия в таком случае стремится к нулю - неопределённости нет, поведение полностью предсказуемо. Теперь вообразите противоположный сценарий: десять результатов в выдаче получают абсолютно одинаковое количество кликов. Энтропия достигает максимума и составляет примерно 3,32 бита - именно столько информации нужно, чтобы указать на один из десяти равновероятных вариантов.

В реальности распределение кликов подчиняется степенному закону, напоминающему распределение Ципфа. Первая позиция в органической выдаче собирает в среднем 27-28% переходов для информационных запросов, хотя брендовые и навигационные запросы могут давать показатели в 40% и выше. Вторая позиция получает около 15-18%, третья довольствуется 10-11%. При этом мобильная выдача демонстрирует ещё более выраженную концентрацию на топовых результатах из-за особенностей вертикальной прокрутки. Такое естественное распределение формирует энтропию в диапазоне полутора-двух с половиной битов в зависимости от типа запроса.

Что энтропия говорит о запросе

Низкая энтропия сигнализирует поисковой системе о ясном намерении пользователей. Когда подавляющее большинство людей выбирает один и тот же результат, это означает, что запрос имеет чёткий ответ, а выдача успешно его предоставляет. Такие запросы обычно носят навигационный характер - человек ищет конкретный сайт или однозначную информацию.

Высокая энтропия рисует иную картину. Если клики распределяются относительно равномерно между множеством результатов, это может означать несколько вещей. Возможно, запрос многозначен и разные пользователи подразумевают разное. Возможно, ни один из результатов не удовлетворяет потребность полностью, и люди вынуждены перебирать варианты. А может быть, тема настолько обширна, что требует изучения множества источников.

Отдельного внимания заслуживает феномен нулевых кликов, когда пользователь получает ответ прямо в выдаче через расширенные сниппеты или панели знаний. В таких случаях энтропия кликов стремится к минимуму не потому, что один результат идеально релевантен, а потому что переходы вообще не совершаются. Для владельцев сайтов это создаёт парадоксальную ситуацию: формально запрос удовлетворён, но трафик проходит мимо.

Поисковая система использует эту информацию для тонкой настройки выдачи. Для запросов с устойчиво низкой энтропией алгоритм может позволить себе более агрессивное продвижение лидера. Для запросов с высокой энтропией система склонна экспериментировать с разнообразием, тестировать альтернативные результаты и учитывать дополнительные сигналы.

Практические следствия для оптимизации

Понимание энтропии кликов меняет взгляд на конкурентный анализ. Недостаточно просто оценить авторитетность сайтов в топе - важно понять характер распределения внимания пользователей. Если по вашему целевому запросу первый результат собирает львиную долю кликов, а остальные делят крохи, пробиться будет исключительно сложно. Система уже определила победителя и не видит причин что-то менять.

Напротив, запросы с высокой энтропией представляют собой территорию возможностей. Равномерное распределение кликов означает, что пользователи не нашли идеального ответа. Здесь качественный контент имеет шанс выделиться и постепенно перетянуть внимание на себя. Алгоритм в таких случаях более восприимчив к новым сигналам и готов пересматривать ранжирование.

Работа над кликабельностью приобретает дополнительное измерение. Заголовок и описание должны не просто привлекать внимание, а точно соответствовать намерению пользователя. Завышенные ожидания приводят к быстрому возврату в выдачу, а этот паттерн учитывается как негативный сигнал. Страница, которая обещает одно, а предоставляет другое, ухудшает свои поведенческие показатели независимо от формальных метрик.

Структура контента тоже играет роль. Если человек быстро находит ответ и удовлетворённо закрывает вкладку - это хороший клик. Если он мечется по странице, возвращается к поиску и пробует другие результаты - плохой. Алгоритм NavBoost, как стало известно из судебных документов, умеет различать эти сценарии.

Уязвимость искусственных сигналов

Энтропия кликов создаёт интересный механизм защиты от манипуляций. Накрутка поведенческих факторов оставляет статистические следы, которые проявляются именно в распределении кликов. Боты и мотивированный трафик ведут себя иначе, чем реальные пользователи с настоящей потребностью.

Дешёвые методы накрутки часто грешат избыточной случайностью. Исполнители или скрипты кликают без понимания контекста, распределяя внимание равномернее, чем это делали бы заинтересованные люди. Энтропия искусственно повышается, что выбивается из ожидаемого паттерна для данного типа запроса.

Более изощрённые схемы пытаются имитировать сфокусированный интерес, концентрируя клики на продвигаемом сайте. Однако здесь возникает противоположная проблема: энтропия падает слишком резко и неестественно. Алгоритм видит, что распределение внимания изменилось без видимых причин - контент остался прежним, конкуренты никуда не делись, а поведение пользователей вдруг радикально сместилось.

Обе аномалии служат красными флагами для антиспам-систем. Естественные изменения в распределении кликов происходят постепенно и коррелируют с другими событиями: обновлением контента, изменением выдачи, сезонными колебаниями спроса. Искусственное вмешательство разрывает эти связи.

Границы концепции

Было бы преувеличением утверждать, что энтропия кликов является решающим фактором ранжирования. Это один из множества сигналов, который работает в связке с сотнями других. Его вес варьируется в зависимости от типа запроса, тематики, региона и множества неизвестных нам переменных.

Кроме того, энтропия - метрика уровня запроса, а не отдельной страницы. Она характеризует поведение всей аудитории, а не качество конкретного результата. Оптимизатор не может напрямую повлиять на энтропию - он может лишь создавать контент, который изменит поведение части пользователей.

Тем не менее концептуальное понимание этого механизма расширяет арсенал анализа. Оно объясняет, почему некоторые позиции кажутся непоколебимыми, а другие - подвижными. Почему одни ниши податливы к новым игрокам, а в других царит застой. Почему иногда отличный контент месяцами не может пробиться в топ, а иногда взлетает за недели.

Поисковые системы продолжают усложнять алгоритмы, извлекая всё более тонкие паттерны из поведенческих данных. Энтропия кликов - лишь одна из граней этого анализа. Но её изучение приближает нас к пониманию того, как машины интерпретируют человеческий выбор и превращают его в ранжирование.