С
Статьи
340
06 Ноября
0

Пытаясь понять Google: определение канонической страницы

admin

Теперь мы есть в Telegram! Самое свежее на нашем канале

Ох, уж этот Google! Порой такое выкатит, что потому у всех вебмастеров голова пухнет. И что он себе только думает… Чтобы понять, как мыслит поисковик, следует почаще заглядывать в его машинно-алгоритмическую голову. Тем более что ход мыслей поисковика частенько описывают его представители…

Нужно прислушаться к его адептам!

Прежде чем приступать к реализации тех или иных действий по SEO-оптимизации сайта, следует понять, как это воспримет Его Величество всемогущий Google. Иначе можно попасть в немилость и стать жертвой поисковых репрессий. Чтобы держать вебмастеров в курсе границ, которые нельзя пересекать, представители Google много и часто рассказывают, куда можно ступать, а куда нет. Серия аудиоподкастов Search Off the Record посвящена именно этим вопросам. В последнем подкасте Гэри Илш и другие сотрудники Google рассказали, как поисковик определяет канонические ссылки… Немного справки Каноническая ссылка – гиперссылка, которая будет проиндексирована. Данное понятие применяется при наличии на сайте дубликатов страниц, среди которых Google выбирает каноническую.

Особенная среди подобных

Гэри Илш рассказал, что при определении канонического URL поисковик учитывает более 20 сигналов (в том числе PageRank и rel = canonical). При этом используется технология машинного обучения. Затем Илш описал более подробно процесс канонизации. Сначала Google находит дубликаты страниц и группирует их. После чего рассчитывает контрольные суммы каждого экземпляра веб-страницы и сравнивает их между собой. Контрольная сумма – это своего рода уникальный отпечаток страницы, вычисляемый на основе ее текстового содержимого. Представитель Google также отметил, что расчет контрольных сумм и их сравнение менее затратный процесс, чем анализ текстового содержимого каждого дубликата. При ее вычислении алгоритмы поисковика не учитывают панель навигации, колонтитул. А также другие элементы, которые могут содержать все страницы сайта. После того как алгоритмы определяют схожие между собой экземпляры, они помещают их в отдельный кластер. Из них поисковик выбирает каноническую страницу, которая будет проиндексирована и отображена в результатах поиска.

Зачем нужна канонизация?

Гэри Илш пояснил, что канонизация применяется не только для очистки выдачи от дублирующего контента, но и чтобы не раздувать поисковый кеш. Вот такие мысли посещают голову великого и могучего Google. Хотя нам его замыслов все равно не понять!
0 комментариев
Добавить комментарий