Найдены страницы-дубли с GET-параметрами, как исправить?

Главные вкладки

Аватар пользователя SergeiSA SergeiSA 20 января в 14:30

Подскажите плз, на конкретном примере как избавиться от этой ошибки в вебмастере?

"Примеры страниц, которые содержат одинаковый контент и различаются только GET-параметрами в URL"

Пример страницы

https://****.ru/photo/bathroom?bathfurniture%5B0%5D=washing&bathfurniture%5B1%5D=cornerbath&style%5B0%5D=12

Страница без get-параметров

https://****/photo/bathroom?bathfurniture%5B0%5D=washing&style%5B0%5D=12

Комментарии

Аватар пользователя OldWarrior OldWarrior 20 января в 21:19

Думаю, ответ вытекает из самого описания ошибки.
Сделайте так, чтобы GET-параметры влияли на уникальность контента, а не выдавали один и тот же ответ.

А вообще - уместнее на форум СЕОшников с такими вопросами.

Аватар пользователя SergeiSA SergeiSA 20 января в 23:21

я думаю, если у вас есть ответ, то можно ответить, а не посылать куда то.
Может есть еще какой то способ в друпале решить эту проблему.

Аватар пользователя OldWarrior OldWarrior 21 января в 2:23

Я, разумеется, прошу прощения, уважаемый, но где в вашем вопросе вообще упоминание о Друпале и теги интересующих вас версий?

Решений (отталкиваясь от того, как именно это реализовано сейчас) может быть множество даже в Друпале. Иными словами - не потрудившись написать хотя бы минимум и скрыв ссылки на сайт - вы скорее меня, читателя, а не себя, посылаете куда-то - предлагая разбирать невесть что и строить предположения о невесть чём.

Вон ниже Андрюха написал о фасетах, читайте. Однако, не факт, что ваш каталог собран именно на views и что фасеты тут помогут.

Аватар пользователя OldWarrior OldWarrior 21 января в 20:18

1. Ну я тут исхожу из того, что если ТС не дал ссылки - значит, он надеется, что никто не будет проявлять инициативу Smile

2. Не понимаю, почему я вообще что-то должен гуглить по обрывкам урлов. Это разве моя проблема?

А впрочем, всем мира. )

Аватар пользователя Andruxa Andruxa 21 января в 1:41

По обеим ссылкам действительно одинаковый контент, а точнее - сообщение, что по заданным критериям фото не найдены. Решается это заменой раскрытых фильтров на фасеты, которые предотвращают публикацию ссылок, по которым будет пустая выдача.
Как на Я.Маркете - выбрали тип кабеля "оптический", и варианты разъемов "usb" будут недоступны или вообще скрыты, поскольку нет оптических usb-кабелей.
Это удобно и пользователям - они сразу видят, какие сочетания фильтров допустимы.
Но, помимо переделки вьюсов и настройки фасетов (в связке с Search API), придется настроить редиректы со старых урлов, находящихся в индексе поисковиков на новые, которые сгенерят фасеты, с большой долей вероятности, они будут другими.
Надо подумать, стоит ли игра свеч.

Странно другое - на страницах прописаны канонические ссылки <link rel="canonical" href="https://****.ru/dizayn-vannoy-komnaty"> которые и предназначены для решения проблем с задваиванием контента при get-параметрах.
Почему вебмастер ругается на задваивание контента с каноническими ссылками - действительно, лучше спросить у специалистов по SEO.

Аватар пользователя OldWarrior OldWarrior 21 января в 2:38

Andruxa wrote: Странно другое - на страницах прописаны канонические ссылки которые и предназначены для решения проблем с задваиванием контента при get-параметрах.
Почему вебмастер ругается на задваивание контента с каноническими ссылками - действительно, лучше спросить у специалистов по SEO.

Есть мысль, что именно по этой причине (одинаковые canonical при разном составе GET) и ругается, да и вообще - возможно только из-за них и обнаруживает рассинхрон по связке "разные параметры GET" - "одинаковый контент". Поскольку канонический URL может и вообще не иметь GET. То есть, мысль в том, что более одного дубля с GET-параметрами для исходного канонического URL возможно воспринимается как нарушение каких-то правил валидации.

Аватар пользователя Andruxa Andruxa 21 января в 11:05

например, utm-метки в урлах: site.com/something?utm_source=xxxx и site.com/something?utm_source=yyyy - абсолютно одинаковый контент, get-параметр нужен исключительно для отслеживания пользователей, в canonical указано site.com/something, и все довольны.

Аватар пользователя pselfin pselfin 22 января в 9:43

Первое - если действительно одинаковый контент и эти дубли не нужные - ставим canonical, как ответили выше.
Но есть второе - canonical может не учитываться ПС, хотя для того и создан, Яндекс Вебмастер все равно ругается даже с канониклом. Для этого есть Clean-param- настраиваете , отправляете на проверку, за недельку должно пропасть предупреждение.