Дублирование контента

Блог

Дублирование контента

Что же происходит при дублировании контента? Контент сайта —это информация на сайте, которая собственно и отличает сайты друг от друга. И очень важно, чтобы он был уникальным.


При дублировании контента вы можете столкнуться с различными проблемами: например, покупаемые ссылки могут привести не на ту страницу, что находится в индексе поисковой системы и, как результат – полное выкидывание из индекса вашей страницы. А это прямой путь к занижению позиций сайта.

Проблему дублирования контента можно разделить на следующие составляющие:
• страница сайта доступна более чем по одному URL адресу — для решения этой проблемы используется редирект 301, который прописывается в файле .htaccess;
• контент содержит не уникальный текст, который встречается на сторонних интернет-ресурсах (преднамеренно или нет) — используются теги noindex и blockquote;
• на сайте присутствуют страницы, состоящие из кусков контента других страниц сайта (например, с результатами поиска) — запрет индексации подобных страниц с помощью файла .htaccess.
Для того, чтобы предотвратить предполагаемые негативные последствия, стоит тщательно разобраться в каких именно случаях происходит дублирование контента на сайте или блоге. Источниками такого контента являются: служебные страницы, RSS-ленты, страницы, предназначенные для печати, дубли контента, создаваемые специальной системой управления сайта. Решить же эту проблему возможно методом запрета на индексацию некоторых типов страниц вашего сайта.
Битрикс поисковая оптимизация

Если возникают проблемы с удалением дублированного контента, то нужно закрыть его от индексации. Для этого используют такие инструменты:
• В html-коде страницы мета-тег «robots». Этот тег имеет для использования такие атрибуты: follow – учитывать ссылки, nofollow – не учитывать ссылки, index — индексировать, noindex — не индексировать, all — индексировать все, none – не индексировать вообще ничего.
• Но обязательно нужно помнить то, что данный тег — это просто инструмент, который указывает роботам поисковиков на то, есть ли возможность индексировать страницу и возможно ли далее следование по ссылкам, что размещены на ней.
• Noindex – это специальный тег Яндекса. С его помощью появляется возможность закрывать какую-либо часть текста, что расположен на данной странице. Это делают для того, чтобы робот, даже видя эту часть, не учитывал ее в поиске.