Помогите разобраться,
на сайте установлен модуль pathauto естественно включены чистые (sef) адреса, все круто работает, но есть проблема. Адрес ноды генерироваться на основе ее название например но друпал почему то дублирует адрес, то есть я могу добраться к ноде как по адресу site.ru/content/node-name так и по адресу site.ru/node/25. Естественно поисковики индексируют эти адреса и идет как бы дублирование контента. Подскажите как решить данную проблему, может что то в настройках pathauto?
Комментарии
Может в поиск, а?
Оно то да) Но я только что от туда, ничего похожего не нашел.
Ради ржаки, приведи в пример запросы по которым искали и ничего не нашли
А слабо дать ссылку на решение этой проблемы?
Поиском находятся несколько обсуждений, но решения там нет. Google все равно находит оба варианта адресов...
Global Redirect
sef адреса -это исключительно терминология джумлы ,а в друпале таких понятий нет .
Зато есть проблемы, описанные ТС.
Поисковики находят и индексируют страницы с адресами типа: site.ru/node/25 и т.п., несмотря на то, что всем страницам присвоенны адреса вида site.ru/node-name.
Global Redirect и Path Redirect установленны, если что...
Global Redirect достаточно чтобы редиректить станицы site.ru/node/nid
А если еще раз внимательно прочитать в чем проблема-то?
Global Redirect редиректит страницы. Ни одной ссылки, ни одной страницы с адресом /node/nid на сайте не найти при просмотре человеком.... Но google упорно индексирует одну и ту же страницу дважды! Один раз как /node/nid , а второй раз как /prisvoennoe-nazvanie-stranicy.
Где он находит ссылки вида /node/nid ума не приложу - все перерыл.
для таких целей есть ещё robots.txt
robots.txt - оно-то понятно, но:
P.S. Кстати, если кто юзает многоязычность, то не забудьте прописать в robots.txt не только /node/ но и /ru/node/ и /en/node/ и т.п.
я слышал в джумле решается легко. го в джумлу.
Показывайте сайт.
Global Redirect все отлично делает и не будет в у вас в индексе страниц вида node/xxx. Но если они уже проиндексировались, то выпадут не сразу.
Такая фигня у меня на парочке сайтов. Ну, например, сайт: dwh-club.com
Google Webmaster Tools показывает, что одни и те же страницы проиндексированны с адресами /node/nid и присвоенными адресами.
Особенно много проблем с англоязычными страницами, которые почему-то попадают в индекс с адресом вида: /ru/node/nid
Например, страница с nid = 87. Эта страница имеет алиас "dwh-bi-articles/change-data-capture-methods.html"
Но она же почему-то проиндексирована и с адресом "/ ru/ node/ 87"
P.S. Кстати, на немультиязычных сайтах такой проблемы у меня нет. Видимо, как-то i18 влияет, чтоль?
PathRedirect
Вроде так модуль зовется.
это ядрёная проблема
Это типа сарказм?
Понятно, что можно в robots.txt запретить индексировать эти страницы.
Вопрос в том, откуда поисковики вообще берут эти ссылки? Где, каким образом и зачем drupal их выдает поисковикам?
Это намёк на то, что надо начинать принимать лекарства, чтобы заговор вокруг не казался.
Известная проблема интернационализации в D6
Какой заговор? Какие лекарства? Если не хочется отвечать, то лучше и не отвечайте.
Зачем, "надувая щеки", с "ученным видом знатока" засорять форум ответами типа: "поиском пользовались?", "известная проблема" и т.п.?
Понятно, галоперидол тут бессилен
Вы поставили глобал редирект? Похоже что нет, т.к. страницы (http://www.dwh-club.com/ru/node/87) открываются без редиректа на их синоним.
Из страницы конечно же. Вы в код заглядывали? Я вот нашел это:
<link rel="up" href="/ru/node/51" />
<link rel="next" href="/ru/node/132" />
Поисковики их тоже найдут.
RxB скорее всего имел ввиду, что многоязычность и Global Redirect имеют вместе проблемы и чтобы их решить нужно гуглить
Слова для поиска в гугле: drupal i18n global redirect
Поставить-то я поставил, но вот что пишут разработчики этого самого редиректа:
Вот собственно и ответ, i18+global redirect приводят к подобной "порнографии"
Спасибо, что перевели на нормальный язык, то что пытался сказать RxB