Дублирование контента. Как бороться со ссылкой типа node/440?page=1

Главные вкладки

Аватар пользователя roadcontrol roadcontrol 5 декабря 2009 в 3:37

У меня под каждой страницей разрешено размещать не более 10 комментариев. Если это число будет превышено - то автоматически создается вторая страница и т.д.

Получается если у статьи 50 комментариев, то будет 5 страниц такого типа:

http://сайт/node/440?page=1
http://сайт/node/440?page=2
и т.д

Так вот... Google индексирует такие страницы и воспринимает как дублирование контента. Например я написал классную статью, которая была много раз перепечатана. Сначала я был на первом месте в поисковике если вбивать название статьи..и вот только что обнаружил что уже на десятом...Гугл проиндексировал страницы 440?page=1, 440?page=2 и т.д..и выдал их в поиск, а главную..почему то нет. Он посчитал что поскольку контент дублируется..то и понизил меня в выдаче...

Целый вечер искал решение проблемы...на этом сайте ничего не нашел...немного говорили об этом на иностранных сайтах...в общем пока что я в robot.txt добавил такую строку:

Disallow: /node/*?page=*

Правильно ли я поступил? И есть ли еще более оптимальные решения данной проблемы?

Комментарии

Аватар пользователя Razunter Razunter 5 декабря 2009 в 5:26

могу ошибаться, но, вроде, в последних версиях nodewords добавили поддержку Canonical URL, которая "объясняет" поисковикам ситуацию ))
Вот отдельный модуль: canonical_url, но автор рекомендует использовать nodewords

Аватар пользователя roadcontrol roadcontrol 5 декабря 2009 в 13:30

Спасибо! У меня стоит модуль nodewords . Поставил галочку на Canonical URL и отметил чтобы тег дублировался на всех страницах типа ?page.. теперь Canonical URL прописывается автоматически на всех list-ах

Аватар пользователя Serg_M Serg_M 5 декабря 2009 в 6:45

Тема мне тоже становится интересна. На drupal.ru уже обсуждалось нечто-подобное, но под другим соусом.

Вопрос, а

инструкция Disallow: /node/*?page=* (верный ли код?)
или канонические ссылки (принял ли их Яндекс?)

разве они не закроют от поисковиков комментарии, ведь порой в комментариях толковой информации не меньше чем в самом посте?

Да и вообще, пролистывание вначале длинного поста и только потом чтение новых комментариев - нудное занятие.
Уже предлагалось на страницах типа http://сайт/node/440?page=1... заменять статью на тизер/анонс - и компактно и дубликата статьи небудет. Вот только найдено ли решение как это сделать?