Robots.txt — управление индексацией сайта

Содержание

Настройка robots.txt
Robots.txt — индексация сайта
Robots.txt закрыть страницу
Host в файле robots.txt
Карта сайта sitemap.xml в robots.txt
Куда загружать robots.txt

На продвижение сайта в поисковой выдаче влияют несколько важных моментов начиная от уникальности его содержания, до тщательного подбора ключевых запросов. Немаловажная роль отводится возможности эффективно управлять индексированием страниц ресурса. Для этой цели и принят общий стандарт в виде текстового файла robots.txt.

Robots.txt — это ключевой элемент управления индексацией веб–ресурса.

Функциональное предназначение robots.txt:

разрешение либо запрет групп или отдельных страниц ресурса к индексации.
обозначение для поискового робота имени главного домена.
указание директории хранения карты сайта.

Для оптимальной раскрутки веб-ресурса перечисленные функции очень важны. Стандартный текстовик robots.txt задает поисковикам определенные правила, управляет индексацией страниц. Правильно прописанные в файле директивы влияют на результат индексации сайта поисковиками в целом: в индексах ресурса исключается многократное дублирование контента, поддерживается должный уровень уникальности и ссылочной целостности.

Настройка robots.txt

Давайте посмотрим как правильно настроить файл robots.txt. Текстовый стандарт наделен несложным синтаксисом и правилами написания. Чтобы создать правильный robots.txt, используется последовательность директив формата:

<Наименование команды>: <Значение>

В основе синтаксической структуры используются команды — User-agent, Disallow, Allow, Sitemap и Host.

Robots.txt — индексация сайта

В значении команды User-agent должно содержаться наименование поискового бота, для которого задаются правила. Например, конструкция User-agent: * означает адресацию правил для всех поисковиков. Если прописываются дополнительные указания для конкретного поисковика, например, Яндекса синтаксис команды следующий: User-agent: Yandex.

В правильно составленном текстовике robots.txt за каждой инструкцией User-agent должен следовать хотя бы один элемент Disallow. Если запреты на индексацию отдельных страниц не планируются, последовательность директив следующая: