Что такое тег rel="canonical"

Тег каноничности (rel=“canonical”) — это фрагмент кода HTML, который определяет каноничную (основную или главную) версию для страниц с одинаковым, практически идентичным или очень похожим содержимым. Если у вас есть одинаковый или похожий контент под разными адресами, вы можете использовать тег rel="canonical", чтобы указать, какая версия является основной, и которую, следовательно, нужно индексировать.

Теги каноничности имеют следующий синтаксис и размещаются в секции <head> веб-страницы (размещать в body запрещено!):

<link rel="canonical" href="https://example.com/page/" />

Каждый параметр этого кода значит следующее:

  1. link rel="canonical": ссылка в этом теге — это основная (каноническая) версия данной страницы.
  2. href="https://example.com/page/: каноническую версию можно найти по этому URL-адресу.

Как робот Googlebot выбирает канонический URL при индексировании?

Когда робот Googlebot совершает обход (индексирует) сайты, он пытается определить основной контент на каждой странице. Если на одном сайте есть похожие страницы, то робот выбирает в качестве канонической ту из них, контент которой он интерпретирует как наиболее полный и полезный. Она будет сканироваться чаще, а похожие варианты или её копии – реже. Эта технология, а уверяет Google призвана снизить нагрузку на сайт при индексировании.

Канонические страницы выбираются по ряду критериев.

Например:

  1. Протокол (HTTP или HTTPS)
  2. Качество страницы
  3. Наличие URL в файле Sitemap
  4. Наличие атрибута rel=canonical в теге head.

Версии одной страницы на разных языках считаются копиями, только если основной контент написан на одном и том же языке. Иными словами, если переведены лишь колонтитулы и прочие незначительные текстовые элементы, такие страницы будут считаться копиями. Подробнее


Рейтинг: 4/5 - 2 голосов

Комментарии ()