Что же происходит при дублировании контента? Контент сайта - это информация на сайте, которая собственно и отличает сайты друг от друга. И очень важно, чтобы он был уникальным.
При дублировании контента вы можете столкнуться с такими проблемами как то: покупаемые ссылки могут привести не на ту страницу, что находится в индексе поисковой системы и, как результат – полное выкидывание из индекса Вашей страницы. А это прямой путь к занижению позиций сайта.
Проблему дублирования контента можно разделить на следующие составляющие:
- страница сайта доступна более чем по одному URL адресу — для решения этой проблемы используется редирект 301, который прописывается в файле .htaccess;
- контент содержит не уникальный текст, который встречается на сторонних интернет ресурсах (преднамеренно или нет) — используются теги noindex и blockquote;
- на сайте присутствуют страницы, состоящие из кусков контента других страниц сайта (например, с результатами поиска) — запрет индексации подобных страниц с помощью файла .htaccess.
Для того, чтобы предотвратить предполагаемые негативные последствия, стоит тщательно разобраться в каких именно случаях происходит дублирование контента на сайте или блоге. Источниками такого контента являются: служебные страницы, RSS-ленты, страницы, предназначенные для печати, дубли контента, создаваемые специальной системой управления сайта. Решить же эту проблему возможно методом запрета на индексацию некоторых типов страниц вашего сайта.
Битрикс поисковая оптимизация
Если возникают проблемы с удалением дублированного контента, то нужно закрыть его от индексации. Для этого используют такие инструменты:
- В html-коде страницы мета-тег «robots». Этот тег имеет для использования такие атрибуты: follow – учитывать ссылки, nofollow – не учитывать ссылки, index — индексировать, noindex — не индексировать, all — индексировать все, none – не индексировать вообще ничего.
- Но обязательно нужно помнить то, что данный тег — это просто инструмент, который указывает роботам поисковиков на то, есть ли возможность индексировать страницу и возможно ли далее следование по ссылкам, что размещены на ней.
- Noindex – это специальный тег Яндекса. С его помощью появляется возможность закрывать какую-либо часть текста, что расположен на данной странице. Это делают для того, чтобы робот, даже видя эту часть, не учитывал ее в поиске.