Дублирование контента

Что же происходит при дублировании контента? Контент сайта - это информация на сайте, которая собственно и отличает сайты друг от друга. И очень важно, чтобы он был уникальным.

При дублировании контента вы можете столкнуться с такими проблемами как то: покупаемые ссылки могут привести не на ту страницу, что находится в индексе поисковой системы и, как результат – полное выкидывание из индекса Вашей страницы. А это прямой путь к занижению позиций сайта.

Проблему дублирования контента можно разделить на следующие составляющие:

  • страница сайта доступна более чем по одному URL адресу — для решения этой проблемы используется редирект 301, который прописывается в файле .htaccess;
  • контент содержит не уникальный текст, который встречается на сторонних интернет ресурсах (преднамеренно или нет) — используются теги noindex и blockquote;
  • на сайте присутствуют страницы, состоящие из кусков контента других страниц сайта (например, с результатами поиска) — запрет индексации подобных страниц с помощью файла .htaccess.

Для того, чтобы предотвратить предполагаемые негативные последствия, стоит тщательно разобраться в каких именно случаях происходит дублирование контента на сайте или блоге. Источниками такого контента являются: служебные страницы, RSS-ленты, страницы, предназначенные для печати, дубли контента, создаваемые специальной системой управления сайта. Решить же эту проблему возможно методом запрета на индексацию некоторых типов страниц вашего сайта.

Битрикс поисковая оптимизация
Если возникают проблемы с удалением дублированного контента, то нужно закрыть его от индексации. Для этого используют такие инструменты:
  • В html-коде страницы мета-тег «robots». Этот тег имеет для использования такие атрибуты: follow – учитывать ссылки, nofollow – не учитывать ссылки, index — индексировать, noindex — не индексировать, all — индексировать все, none – не индексировать вообще ничего.
  • Но обязательно нужно помнить то, что данный тег — это просто инструмент, который указывает роботам поисковиков на то, есть ли возможность индексировать страницу и возможно ли далее следование по ссылкам, что размещены на ней.
  • Noindex – это специальный тег Яндекса. С его помощью появляется возможность закрывать какую-либо часть текста, что расположен на данной странице. Это делают для того, чтобы робот, даже видя эту часть, не учитывал ее в поиске.