среда, 16 декабря 2009 г.

Blogger: запрет индексирования главной

Давненько уже подумывал о том, чтобы запретить индексацию главной — хочется избежать такой вот чепухи:
Чепуха в выдаче Гугла
Позавчера таки собрался и сделал, пока что работает :)

Для того, чтобы добавить в свой блог аналогичную фичу, выполните следующее (желательно предварительно сохранить бекап своего шаблона; сделайте это после выполнения пункта 2):
  1. перейдите на Панель инструментов и кликните по ссылке Настройка рядом с названием вашего блога
  2. перейдите на вкладку Дизайн, а там — в секцию Изменить HTML
  3. в самое начало кода, сразу после <title><data:blog.pageTitle/></title>, допишите:
    <b:if cond='data:blog.pageType == "index"'>
    <!-- allow robots to follow links on main page, but forbid page indexing -->
    <meta content='noindex,follow' name='robots'/>
    </b:if>
  4. нажмите Сохранить шаблон
Дело сделано! При следующем заходе на ваш блог боты не станут индексировать главную, так что она не будет всплывать в выдаче поисковиков.

Для любопытных

Теперь объясню, что это мы только что написали :)

Код представляет собой простое условие, состоящее в определении типа страницы — «index» означает главную. data:blog.pageType — переменная, в которой хранится тип текущей страницы. Итак, мы выяснили, что говорит условие: «если мы на главной, то…».

Тег meta является стандартным HTML тегом, используемым для передачи метаинформации (неожиданно, да? :) вроде заголовка страницы (который отображается в заголовке окна браузера), адресов RSS и Atom фидов, указания кодировки страницы и прочего. Одним из возможных передаваемых значений являются указания поисковым роботам, которые мы используем.

Итак, name='robots' указывает на то, что тег предназначен для роботов, а content='noindex,follow' говорит, что роботам можно переходить по ссылкам с этой страницы (что приведёт их к постам), но нельзя запоминать содержимое текущей страницы (то есть индексировать её). Таким образом, боты будут знать только о постах и при поиске выдача будет нормальной, без чепухи, приведённой на скрине выше.



При подготовке материала использовалась система помощи Blogger.

Копируете статью — поставьте ссылку!

4 комментария:

sash-kan комментирует...

google-spider, «заходящий» на blogspot.com???
что ему там делать???

Minoru комментирует...

Почему нет? А как ещё постам в выдачу гугла попасть, кроме как через бота? Вы же сами видите скриншот.

ffsdmad комментирует...

а что он индексировать будет?
блоггер даёт sitemap.xml - как пауки найдут новые страницы?

Minoru комментирует...

Не знаю, что там с sitemap.xml, но после применения описанного решения главная из выдачи гугла исчезла. А новые страницы бот найдёт без проблем — по ссылкам-то с главной ходить можно.

Отправить комментарий

Примечание. Отправлять комментарии могут только участники этого блога.

 
Blogger logo Debian logo Creative Commons License FeedBurner Subscribers Counter