miralinks.ru

Тег canonical поможет спастись от дублированного контента

Рубрика: Теория и статистика | Время на чтение: 5 мин.

Канонический тег (rel=”canonical”) является довольно важным инструментом поисковой оптимизации. Зачастую он даже лучше, чем 301 редирект при работе с дублированным контентом.

Канонический тег

Разберём более подробно этот тег.

Что плохого в дублированном контенте

Дублированный контент – это два одинаковых по своему содержанию документа. Когда Google видит дубль, он старается исключить его из индекса, т.к. по идее пользователь не захочет видеть один и тот же документ в поисковой выдаче несколько раз. Да и к тому же самому поисковику не хочется постоянно обрабатывать тысячи и даже миллионы дублированных страниц, тратя на это свои производственные мощности.

Проблема для веб-мастера состоит в том, что если одна и та же информация находится на разных страницах, то в выдаче будет только одна из этих страниц. Но url, который выберет Гугл, не всегда является наиболее оптимальным для пользователя, и не всегда является первоисточником.

Пока поисковик не определит первоисточник, результаты выдачи не будут удовлетворять целям первоначального автора контента. В данном случае канонический тег имеет ограниченную пользу, поскольку те, кто крадут ваш контент, скорее всего, не будут ставить теги.

С другой стороны, если дублирование происходит на вашем сайте, то тег будет как нельзя кстати. Даже если на вашем сайте будут ссылки на дублированный контент, ценность для выдачи будет составлять только страница-первоисточник. Таким образом, даже при наличии ссылок на несколько дублей, значимой для Google будет считаться только одна из этих страниц. И внутренняя перелинковка не пострадает.

Естественно, это не лучшее решение с точки зрения SEO. Но это не приведёт к каким-либо санкциям со стороны Гугла.

Что такое тег rel=”canonical”

Тег имеет следующий синтаксис: <link rel=”canonical” href=”https://seo-aspirant.ru/www.example.com/url-i-want-to-appear-in-google”/> Таким образом Google и Bing поймут, что все дубли ссылаются на канонический адрес, указанный в теге. Гугл имеет чёткое представление по поводу использования данного тега:

Да, rel=”canonical” должен использоваться только для выбора предпочитаемой страницы при дублировании (незначительные различия в содержании допустимы).

Другими словами, используйте его только для борьбы с дублированным контентом. При использовании его для других целей вы можете быть уличены в поисковом спаме.

Проблемы дублированного контента

Реализуйте теги надлежащим образом на вашем сайте. Это убережёт вас от проблем дублированного контента, некоторые из которых связаны с системами управления сайтами (CMS):

  1. Tracking Codes. Некоторые системы требуют добавления переменных в конце url-адреса для обратных ссылок на ваш сайт. Формат может быть такой: www.example.com?tracking-variable или такой: www.example.com/example.htm?tracking-code. Проблема заключается в том, что поисковые системы разделяют адреса, даже если те различаются всего одним символом. Хотя Google и Bing и имеют в своём распоряжении технологии, которые помогают определять такие адреса, до сих пор возникает множество ошибок при их обработке. Интересно будет отметить, что некоторые ссылаются на ваш сайт, дабы получить взаимную обратную ссылку, используя данный метод. Канонический тег защитит вас от этого.
  2. Приставки к url. Как мы уже уяснили, любые два адреса, отличающиеся хотя бы одним символом, рассматриваются как отдельные страницы. И есть несколько случаев, когда приставки к адресам могут привести к дублированию контента. К ним относятся, например, дополнительный язык сайта (русская и английская версии страницы) или создание движком дополнительных страниц (ярко выражено в WordPress).
  3. Разбивка на страницы. Это когда сайт разбивается автоматически на несколько страниц с одинаковым контентом. Например, если у вас интернет-магазин и продукцию можно отсортировать по цвету товара или по его цене (при этом для результата сортировки генерируется отдельная страница с одинаковыми описаниями товаров).
  4. WWW. По большей части это не проблема, т.к. Google обычно правильно определяет адреса с www и без. Но до сих пор бывает такое, что поисковик индексирует как бы две версии сайта (example.com и www.example.com). В результате половина вашего контента проиндексирована с www, а другая половина – без www. Обычно это дело прописывается в robot.txt, но и канонический тег тут тоже может помочь.
  5. Если невозможно реализовать 301 редирект. Как ни странно, но в некоторых случаях у веб-мастера нет возможности реализовать 301 редирект, например, из-за ограниченного доступа к серверу. Канонический тег в данном случае является альтернативой, с той лишь разницей, что исходная страница будет продолжать существовать.

Но всё-таки, в соответствии с политикой Google, канонический тег это рекомендация, а не обязательное для исполнение правило. Эта опция поможет владельцам сайтов самостоятельно указывать, какую страницу Гугл должен считать канонической. Таким образом, для Google будет проще определить, какую страницу необходимо включить в индекс при дублировании контента.

Используя тег rel=”canonical” для каждой страницы, вы укажете точные url-адреса поисковому роботу. Это поможет избежать многих проблем, возникающих при дублях в содержании и, соответственно, повысит позиции вашего сайта в поисковых системах.

SEO-aspirant

ПОНРАВИЛСЯ ПОСТ? ПОДЕЛИСЬ ССЫЛКОЙ С ДРУЗЬЯМИ!

Получать новые публикации по электронной почте:

СТАТЬИ ИЗ РУБРИКИ:

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

7 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
trackback
13 лет назад

Тег canonical поможет спастись от дублированного контента | блог SEO-аспиранта…

Практически каждая широко распространённая система управления сайтом при своей работе создаёт дублированный контент. Это могут быть страницы навигации, различные варианты сортировки товаров или англоязычная версия сайта. Как бороться с дублированным ко…

greggromov
greggromov
11 лет назад

А это считается дублированным контентом?:
анонс новости ,который появляется на главной странице,формируется из текста самой новости.В итоге одно и тоже “предложение” появляется на 2х страницах сайта.

И что поисковая система будет считать дублем,если на главной после анонса идет ссылка на новость?

seo-aspirant
11 лет назад
Ответить на  greggromov

Да, считается дублированным. Я, например, не парюсь по этому поводу. Если хотите это дело исправить, то вот Терехов недавно статью написал – http://www.terehoff.com/case-maul-wildo-review.html

persona-segreto.livejournal.co
persona-segreto.livejournal.co
10 лет назад

Хорошо, а все ли поисковые поддерживают этот тег? ? Вот недавно у блогера Деваки читал, что Яндекс точно поддерживает, ну а Бинг, Яху, Альтависта?

Natalie Didenko
Natalie Didenko
1 год назад

а если сайт мультиязычный, то какой canonical нужно прописывать для переведённых страниц, чтобы Google не считал их копиями? По факту (без canonical) он считает их копиями, а сам в качестве канонической страницы выбирает URL без языка

Аспирант
1 год назад
Ответить на  Natalie Didenko

Если ваш сайт ориентирован на международный трафик, то есть вы направляете пользователей в разных странах на разные канонические страницы, вам необходимо иметь канонические теги для каждого языка.

Natalie Didenko
Natalie Didenko
1 год назад
Ответить на  Аспирант

окей, спасибо. Я не прописывала canonical для мультиязычных страниц, потому что в гугле эта инструкция указана как рекомендательная, а не обязательная. Тем более что страницы исходного языка и перевода кардинально отличаются по контенту – как по информации, так и по интерфейсу. И по словам того же гугла, для него это веский аргумент, чтобы не читать страницы дубликатами. Но по факту он всё равно посчитал их дубликатами, что вылилось в кучу ошибок в консоли. Сегодня пропишу canonical для всех мультиязычных страниц (а не только для явных дубликатов, как раньше), посмотрим, как пройду проверку

7
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x