Дублированный контент

Многим не нравится, когда кто-то повторяет одно и то же. Точно так же и поисковым
механизмам "не нравится", когда подобное делают Web-сайты. Эта проблема называется
дублированным контентом (duplicate content) и определяется как Web-контент,
который в точности или в значительной мере совпадает с контентом, находящимся
по другим адресам. Понятно, что дублированный контент не содержит ничего нового.
Это важно понимать. Новизна — важный фактор в человеческой оценке значимости,
и поисковые механизмы учитывают подобные человеческие чувства в своих алгоритмах.
Вывод нескольких страниц одинакового контента не нравится пользователям.
Поэтому и поисковые механизмы содержат сложные алгоритмы, которые распознают
такой контент и выбрасывают его из результатов индексирования.
Кроме того, индексирование и обработка дублированного контента тратит память
и время поисковых механизмов. Аарон Уолл (Aaron Wall) на сайте h t t p : / /www.
seobook. сот/ утверждает: "Если страницы слишком похожи, то Google (или другой
поисковый механизм) может предположить, что они не очень важны или содержат контент убогого качества"; В результате Web-сайт может индексироваться менее часто или менее тщательно. И хотя среди специалистов по поисковому маркетингу нет единого мнения, накладывают ли различные поисковые механизмы явный штраф, все-таки все согласны, что дублированный контент может причинить вред.
Поэтому нужно стараться максимально устранять дублированный контент с Web-
сайта. В данной главе описаны наиболее распространенные причины дублирования контента из-за архитектуры Web-сайта. Затем будут предложены методы его устранения или удаления из поля видимости поискового механизма. В этой главе вы:
• узнаете о возможных негативных эффектах дублирования контента;
• рассмотрите наиболее распространенные виды дублированного контента;
• научитесь исключать дублированный контент с помощью файла robots. t x t и
дескрипторов meta;
• используете PHP-код для надлежащей реализации партнерской программы.