Дубли страниц

Главные вкладки

Аватар пользователя Ivaseg Ivaseg 26 марта 2016 в 18:29

1. Допустим страница доступна по урл http://site.com/simplepage/, если вручную в конце пути дописать что-нибудь, скажем ?aaa (получится урл http://site.com/simplepage/?aaaa), то загрузится содержимое страницы http://site.com/simplepage/. По логике для такого урл должно было выдать ошибку 404, иначе с точки зрения сео, на сайте может быть бесконечное кол-во дублей страниц.

2. Вьюха выводит контента на 3 страницы, последняя страница имеет урл http://site.com/news?page=2. Если в урл дописать номер страницы больше чем их есть на самом деле (например http://site.com/news?page=26), все-равно откроется содержимое последней страницы, т.е. http://site.com/news?page=2. Это опять же дублирование, и должно выводить 404 ошибку.

3. Чувствительность к регистру в урл. Оригинальная страница имеет урл http://site.com/simplepage/, если в браузере поменять скажем на http://site.com/siMplEpaGe/ - загрузит содержимое страницы http://site.com/simplepage/. Опять же выходит дублирование информации.

Как все это можно исправить?

Комментарии

Аватар пользователя negociant negociant 26 марта 2016 в 20:22
1

1. - https://www.yandex.ru/?sss - ответ сервера 200
2. - На страницы пейджера, больше чем есть страниц есть ссылки на сайте?
3. Это настройки сервера, а не друпала.

Ivaseg wrote:

Как все это можно исправить?

Уволить недосеошника.

Аватар пользователя Ivaseg Ivaseg 27 марта 2016 в 0:47

1. Интересно) Чем это объясняется? Если это нормальное поведение, то где можно почитать про это, полезно и для своих знаний и доказывать свою точку зрения.
2. Нет, на сайте нет таких ссылок, но это же не значит что кто-то на каком-то сайте не наспамит таких ссылок. Все же логика проста: если такой страницы нет, то 404, а не показывать самую последнюю существующую страницу.
3. На хостинге понятное дело что доступа к настройкам апача нет. Или вы о .htaccess? Кто-то делал подобное (пример не помешал бы)? Спасибо.

negociant wrote:
Уволить недосеошника.

Не все так просто) Я к наему сеошника отношение не имею, а чтобы объяснить нанимателю что это недосеошник, нужно аргументированно это доказать.

Аватар пользователя serega111 serega111 27 марта 2016 в 15:15

1. С подобным вопросом сюда приходят регулярно. Происходит это из-за особенностей реализации роутинга с единой точкой входа. Погуглите, почитайте. Используется он во большинстве CMS и фреймворков.
А чтобы отстоять свою точку зрения, достаточно спросить сеошника (а скорее недосеошника), каким же образом поисковик придет на страницу с урлом http://site.com/simplepage/?aaaa ? Где он возьмет эту ссылку? Чтобы бы давать советы по СЕО, нужно знать хотя бы элементарные принципы работы поисковиков.
2. Ответ тот же самый - каким образом поисковик попадет на 26 страницу листинга, если ссылки на нее не существует?
3. Вы удивитесь, но и здесь напрашивается тот же самый ответ.

Аватар пользователя Ivaseg Ivaseg 27 марта 2016 в 16:09

Поисковик придет на такие страницы, если кто-то на каком-то сайте их пропишет, и они там проиндексируются. Исключать вариант что такого никогда не случится - не совсем корректно как по мне.