Пользовательская активность и Google
Поговорим о том, как Google анализирует и дает интерпретацию разнообразной информации, после запуска алгоритма «Панда». На недавно прошедшей презентации Эрика Энга в Остине на PubCon, он заметил, что с момента запуска алгоритма пользовательские показатели были «накручены» до 20%.
Таким образом, Google подстраивается под современные требования, которыми сейчас правят социальные медиа и пытается сделать максимальный анализ пользовательских параметров, учитывая демографическую, психологическую и поведенческую обстановку. Проанализировав сложившуюся ситуацию можно составить список источников информации, которые используются Google как сигналы.
Под метрикой пользовательской активности подразумевается агрегатный индекс поведения пользователей, легко совместимый с данными об успешном поиске, который может применяться как мощный способ аналитики для разнообразных сайтов. Скорее всего, со временем именно данная метрика будет определять качество сайта, заменяя постепенно Page Rank. И эта метрика, с которым Google рассчитывает улучшить качество поиска - алгоритм Панда.
Пандой определяется куча параметров еще до того, как пользователем будет набран интересующий запрос в Google:
1. Как пользователь оказался в Google?
- Зашел через тулбар (тулбар Google или другой).
- Используя какой - либо партнерский сайт (Aul и тому подобное).
- Какой тип браузера был использован: десктопный, мобильный, планшетный либо другой.
- Через ссылки с других сайтов.
- При помощи ссылки с социальных сетей (Orkut или Twitter, либо, к примеру, используя контрольную панель Wordpress).
2. Где пользователь расположен?
- Его IP адрес.
- GPS сведения, если таковые есть (в зависимости от навигационного устройства).
- Информация о расположении пользователя через тулбар Google.
- Сведения о сети WiFi, мобильном телефоне или иная информация о провайдере интернета.
3. Характеристики браузера
- Его вид, платформа и прочее.
- Набор разрешенных протоколом http файлов: java, gzip, flash и другое.
- Параметры экрана.
- Метрика тулбара и история его установки, а также похожая информация, к примеру, о том, какая версия тулбара применяется.
4. Анализ сайтов и рекламы
- Отслеживание сайта, с которого пришел пользователь и что он делал там (может быть, что на этом сайте был установлен код Google Analytics либо код другой метрики Google)?
- Общая информация о статистике Google Analytics, а также AdSense (при каждом посещении сайта, на котором установлен код Google, пользователь сообщает о себе разную дополнительную информацию).
- В дальнейшем к этой метрике будут прибавлены сведения, полученные от использования кнопок +1 data представленные новым одноименным сервисом Google.
5. Куки
- Google Properties или My Googlе, Youtube, Gmail и другие.
- Определение сайтов, где вы были авторизованы, просматривали рекламу Google от DoubleClick либо AdSense. В том случае, если пользователь зашел в свою панель Wordpress используя "foofoo.com", а затем просмотрел рекламу AdSense на этом сайте, то Google получает дополнительный сигнал, при помощи которого его можно отследить.
Сбор этих данных дает Google 70-75% сведений о вашем поведении в интернете, остальные 15-25% информации вычисляются по вышеуказанным данным. Даже при наличии динамического IP и будучи не авторизованным ни в одном из вышеупомянутых сервисов, Google определит Ваш профиль и сопоставит всю собранную информацию. Таким образом, у Google имеются сведения о 90% пользователей с разных уголков мира. А остальные 10% можно будет вычислить в перспективе, после создания учетной записи в одном из сервисов Google (к примеру, Gmail).
Когда пользователем вводится запрос в поисковую строку Google (если поиск происходит не через тулбар или партнерский сайт) Панда уже может определить некоторые параметры:
Запрос:
- При помощи психографики или того, как пользователь формулирует запрос в поисковой строке, получаются сведения об образованности и разных других социальных и демографических признаках.
- Такие данные, как: язык, орфография, синтаксис, форматирование и прочее дают представление о пользователе, и что он ожидает от поиска.
Поведение на СЕРП:
- Действия пользователя после того как он навел мышкой на превью результатов поиска?
- Если пользователь наводит мышкой на название сайта или его описание, то это трактуется как его намерение и в метрике это учитывается.
- Определение мультивариативной метрики при тестировании ( Google достаточно регулярно на своем СЕРП проводит тестирование).
Внешняя метрика Google.com.
Теперь рассмотрим фактор клика на результат.
- Какая используется Реклама: AdSense или DoubleClick?
- Имеется ли код Google Analytics?
- Куда кликает пользователь на сайте? В скором времени можно будет учитывать информацию с сервиса +1.
- Какое количество времени пользователь находится на входящей странице?
- Осуществляется ли пользователем переход на другие страницы сайта?
- Используется ли пользователем кнопка «Назад» в браузере и возвращение на СЕРП Google либо при переходе он использует другие ссылки?
- Информация из тулбара. Подписан ли пользователь на какие – либо сайты, имеются ли заблокированные сайты.
Недостаточно известные параметры
- В Google используется разные необычные источники данных, собранные в местах, которые посещают массовые пользователи. К примеру, Captcha, которая определяет поврежденные слова в проекте Google при сканировании книг. Но у Google имеются и другие разнообразные способы сбора информации о пользователях.
Подведя итоги, можно сказать, что поступающая с помощью Панды информация определяет количественные характеристики пользователей и условное местоположение любого запроса относительно общей иерархии.
Применение алгоритма Панда вызывает ряд дополнительных вопросов:
- Заинтересован ли Google, чтобы пользователи покидали подходящий, найденный по интересующему их запросу сайт, и вернулись бы обратно на Google.com?
- При успешном результате поиска в Google, будет ли пользователь продолжать пользоваться Google?
- Действия Google при перенаправлении ответных запросов?
- Влияет ли персонализация на метрику Google?
- Изменяются ли сами результаты алгоритма при отслеживании метрики Панда?
- Не изменяется ли сама информация от метода ее сбора?
При использовании данного метода сбора и анализа вышеуказанных сведений и использование этих сведений в рамках алгоритма, в результате получается завышенное количество довольных пользователей. Может быть, именно данный факт послужил для Google началом обновления алгоритма Панда: использование количественных характеристик качественного контента, который дает низкую степень отказов и значительную активность пользователей, дало высокие результаты при запуске начальной версии Панды. Сможет ли новая Панда решить эти вопросы?
Наша специализация — работа с разными объемами и тематиками. Сайты-визитки, порталы, интернет-магазины.
Нами успешно реализовано более 113 проектов.