Атрибут rel=canonical. Что такое канонический URL и как им пользоваться

Атрибут rel=canonical позволяет бороться с дублями страниц. Когда одно и то же содержимое доступно по разным URL, канонические ссылки указывают главную страницу. Эта  страница (приоритетная) как раз и будет находиться в индексе поисковых систем и весь вес со страниц дубликатов будет перетекать на основную страницу.

Атрибут canonical прописывается на страницах дублей с указанием наиболее приоритетной страницы в разделестраницы вот так:

<link rel="canonical" href="http://site.ru/osnovnoj-url" />

Данный тег прекрасно понимают все основные поисковые системы и канонические ссылки являются для некоторых типов страниц неотъемлемыми с точки зрения SEO оптимизации. Об этом всем мы с вами поговорим сегодня.

Оглавление:

  • Rel canonical: что это
  • Откуда могут появиться дублирующиеся страницы?
  • Статья сайта относится к нескольким рубрикам
  • Товары интернет-магазина в нескольких категориях
  • Страница печати, разные id
  • Тег more
  • Дубли replytocom
  • Партнерская программа
  • Как правильно использовать rel=canonical
  • Как правильно выбрать канонический урл?
  • Частые ошибки с атрибутом rel=canonical
  • Частные случаи использования rel=canonical
  • Сanonical сама на себя
  • Canonical для страниц пагинации
  • Товары
  • Атрибут rel=canonical в WordPress
  • Выводы

к оглавлению ↑

Rel canonical: что это

Когда на один и тот же контент можно попасть с помощью разных URL’ов, в индексе поисковых систем начинает участвовать сразу несколько страниц. В итоге ни одна страница толком не продвигается, так как внутренние ссылки идут то на одну страницу, то на другую.

Тоже самое касается внешних ссылок. Невозможно сосредоточиться максимально на продвижении одной страницы, а это в итоге не раскрывает потенциал страницы полностью. Или же, к примеру, покупаются ссылки на одну страницу, а на самом деле в индексе совершенно другая страница.

В результате чего сайт будет занимать позиции ниже, чем мог бы. Атрибут rel=canonical как раз позволяет нам оставить в индексе только самую приоритетную страницу. Также весь ссылочный вес передается на нее.

Чтобы в индексе была только одна страница, нужно прописать на страницах дубликатах в разделеканоническую ссылку на приоритетную:

<link rel="canonical" href="http://site.ru/prioritetnya-stranica" />
к оглавлению ↑

Откуда могут появиться дублирующиеся страницы?

Если для удаления дублей, можно воспользоваться 301 редиректом, я рекомендую в первую очередь обратить внимание на него. Если же 301 редирект не помогает или его использование неуместно, то на помощь можно позвать канонические ссылки, только будьте аккуратными.

к оглавлению ↑
Статья сайта относится к нескольким рубрикам

Если в ЧПУ вашего сайта выводится рубрика статей, то можно столкнуться с проблемой. Одна и та же статья может располагаться сразу по нескольким URL адресам. Вот у меня, к примеру, есть статья про безопасность в WordPress, она располагается сразу в 2-х категориях: «Полезное для блога» и «WordPress плагины». Поэтому доступна сразу по 2-ум разным URL адресам:

  • https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html
  • https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html

Это для нас, обычных посетителей, как будто страница одна и та же. Для поисковиков же это 2 разные страницы, которые являются дублями. И они могут включить в индекс либо сразу обе страницы, либо не ту, которую хотелось бы. Как раз в подобных случаях выручает rel=canonical, который позволяет указать поисковикам, что нужно проиндексировать только одну конкретную страницу.

В моем случае со страницы https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html прописан канонический URL на https://wpnew.ru/sozdanie-bloga/razdel-4-plaginy/bezopasnost-wordpress.html и поэтому в индексе только второй вариант страницы.

Данный rel=canonical у меня прописывается автоматически с помощью плагина для WordPress, более подробно в конце урока.

к оглавлению ↑
Товары интернет-магазина в нескольких категориях

Еще одно из самых популярных явлений, это когда товары в интернет-магазинах расположены сразу в нескольких категориях. В виде примера приведу товар iPhone 6s, который может располагаться сразу на нескольких страницах:

  • site.ru/apple/iphone6s/
  • site.ru/mobilnye-telefony/iphone6s/
  • site.ru/catalog/iphone6s/

Все точно также, нужно указать со всех страниц rel=canonical на основную, приоритетную страницу. Как выбрать правильно каноническую страницу расскажу ниже.

к оглавлению ↑
Страница печати, разные id

Также на некоторых страницах встречаются страницы для печати. У них к URL  добавляется что-то вроде ?print=true. То есть, один и тот же контент может находиться на:

  • site.ru/content/post-1;
  • site.ru/content/post-1?print=true.

В таком случае со страницы site.ru/content/post-1?print=true нужно прописать в область(внимание, не в body!) следующее:

<link rel="canonical" href="http://site.ru/content/post-1" />

Благодаря этому действию, страница site.ru/content/post-1?print=true не будет участвовать в поиске, то есть не будет проиндексирована.

Также встречаются всякие &id=xxx , с ними боремся точно так же.

к оглавлению ↑
Тег more

Еще один популярный тег присваиваются статьям в стиле /#more-777 , который прописывается к URL. Чаще всего такое можно заметить на шаблонах WordPress, особенно старых. Чтобы в индекс попадала правильная страница, аналогично на странице site.ru/post#more-777 должно быть прописано :

<link rel="canonical" href="http://site.ru/post" />

Я же в идеале бы рекомендовал делать ссылки прямыми (с той же самой главной страницы), без тега more.

к оглавлению ↑
Дубли replytocom

Точно также бывает с ?replytocom=777 , которые могут попасть в индекс из-за древовидных комментариев. Делаем все по аналогии. Я же для борьбы с дублями replytocom просто ставлю галочку в плагине Yoast SEO и данная проблема больше не беспокоит:

к оглавлению ↑
Партнерская программа

Когда реализуете партнерскую программу, часто много ссылок c «хвостами» начинают ссылаться на вас. Получается, что-то вроде этого: site.ru/?partner=id777. С подобных страниц тоже нужно прописывать атрибут canonical, чтобы они не попали в индекс.

к оглавлению ↑

Как правильно использовать rel=canonical

Как вы уже поняли, чтобы в индексе был только 1 вариант страницы, нужно со всех дублирующихся страниц проставить атрибут canonical. Вот как он должен выглядеть

<link rel="canonical" href="http://site.ru/osnovnoj-url" />

Данный тег должен находиться внутри.

к оглавлению ↑

Как правильно выбрать канонический урл?

Каноническая страница — это та страница, которая рекомендуется поисковикам для индексации среди всех дублей. Какую же лучше выбрать?

  • Если страница раньше имела только 1 url, то лучше сделать канонической ее, так как скорей всего она уже проиндексирована, также имеет определенный вес. То есть с новой страницы проставить rel=canonical на старую.
  • Если же страницы создавались примерно в одно время, лучше каноническим URL сделать ту, которая находится в индексе.
  • Если же несколько страниц-дублей находится в индексе поисковиков, то лучше выбрать тот, который будет продвигаться. Чаще всего тот URL, который имеет меньше всего уровень вложенности, либо уже имеет входящие ссылки.
  • Если же все условия идентичные у страниц дублей, обычно берется за приоритетную страницу та, которая подходит под некий шаблон товара/статьи по сайту и предпочтение отдается единообразию.

к оглавлению ↑

Частые ошибки с атрибутом rel=canonical

  • Тег rel=»canonical» — это не строгая директива. Он лишь предлагает основную страницу для поисковиков, то есть просто-напросто советует.
  • Нельзя использовать другой домен в данном атрибуте. Допускаются ссылки только внутри домена или поддомены.
  • Для проставления канонических ссылок необязательно иметь 100% дублированный контент, если есть небольшие различия — это нормально. Такое может быть, когда продукты расставлены в другом порядке или поисковый робот посетил страницы в разное время, например.
  • Если документ по каноническому адресу недоступен (отдает 404 ошибку, допустим), то поисковики могут проигнорировать его.
  • Также поисковые роботы могут проигнорировать данный атрибут, если на странице указано несколько канонических урлов.
  • Для указания канонического ссылки допускается использовать не полный URL адрес, а относительный путь:
    <link rel="canonical" href="/osnovnoj-url" />

    Но будьте аккуратны, можете «наломать дров», лучше использовать полный URL, с указанием вашего домена.

  • Каноническая страница должна быть индексируемой.
  • Запомните: rel=canonical передает вес входящих ссылок.

    Почитайте еще эти статьи (официальные руководства от Яндекса и Google):

    • Атрибут rel=canonical тега в Яндекс Помощи.
    • Канонические URL в справке Google Search Console.

    к оглавлению ↑

    Частные случаи использования rel=canonical

    к оглавлению ↑
    Сanonical сама на себя

    Меня не раз спрашивали, можно ли ставить каноническую ссылку саму на себя? Такое обычно происходит при автоматической генерации с помощью разных плагинов или силами CMS. Ответ — да, можно, ничего в этом плохого нет.

    к оглавлению ↑
    Canonical для страниц пагинации

    Многие вебмастера хотят сделать rel=canonical со страниц пагинации (site.ru/category/page/2) на первую страницу (site.ru/category). Это неправильно, как я считаю. Все-таки здесь встречаются не полные дубли, такие страницы пагинации лучше закрыть с помощью:

    <meta name="robots" content="noindex,follow"/>

    В WordPress это можно сделать автоматически, поставив галочку в плагине WordPress SEO by Yoast:

    к оглавлению ↑
    Товары

    Если товары разделены на несколько страниц (их много и сделана разбивка на несколько страниц), то лучше основным каноническим урлом сделать вывод всех товаров, которое обычно выводится с помощью добавления к URL что-то подобное этому ?all=products.

    к оглавлению ↑

    Атрибут rel=canonical в WordPress

    Многие SEO плагины для WordPress очень хорошо дружат с атрибутом rel=canonical. Мой любимый и, как я считаю, лучший SEO плагин Yoast SEO вообще ничего не требует. Просто достаточно его активировать и необходимые канонические URL сами прописываются.

    В некоторых других SEO плагинах в настройках нужно просто поставить галочку напротив «Канонические страницы» (или еще что-то подобное).

    То есть по умолчанию, если статья на моем блоге присвоена сразу к нескольким категориям, то автоматически прописывается каноническая страница. Именно поэтому на странице https://wpnew.ru/sozdanie-bloga/poleznoe_dlya_bloga/bezopasnost-wordpress.html у меня прописан следующий атрибут rel=canonical (обратите внимание, это другой URL):

    По умолчанию, благодаря плагину Yoast SEO, если пост располагается сразу в нескольких категориях, в индекс же попадает только один вариант.

    к оглавлению ↑

    Выводы

    Я надеюсь, что вполне понятно, смог объяснить, что такое атрибут rel=canonical и как им пользоваться. Настоятельно рекомендую ознакомиться вам еще с этим уроком: Как удалить ненужные страницы в индексе Яндекса и Google. Все эти действия с rel=canonical, 301-ым редиректом, meta name robots, файлом robots.txt позволят сделать выдачу вашего сайта «чистым».

    Я за «чистый» индекс без дублей, служебных страниц и пр. ненужных вещей. Благодаря чистоте SEO продвижение сайта будет проще и правильнее.

    И еще: чтобы не было подобных заморочек я рекомендую будущие ваши сайты создавать без указания категорий в URL статей/товаров. То есть пусть будет что-то вроде:

    • site.ru/statya.html (для блогов);
    • site.ru/catalog/iphone6s (для интернет-магазинов).

    Отдельное спасибо за ретвиты и репосты, мои друзья. Обязательно жду ваших мыслей в комментариях.

    https://wpnew.ru/raskrutka-bloga/seo_optimizaciya/rel-canonical.html

    Оставить комментарий