Откуда могут появляться страницы с /node/*

Аватар пользователя Konstantin Konstantin 19 декабря 2020 в 13:35

Здравствуйте

Ситуация такая, все ссылки на сайте с чпу, на страницах ссылки типа /node/* не появляются ни в каком виде. Гугл где то находит такие ссылки и пытается их сканировать, получая 404. (это видно по логу сервера и серчконсоли) Никто не может подсказать откуда он их узнает и каки образом от них избавиться?

Комментарии

Аватар пользователя Konstantin Konstantin 19 декабря 2020 в 14:08

Извиняюсь, уточняю, страницы типа /node/* отсутствуют их нет они возвращают код 404 и это правильно, так настроено, вопрос в том откуда гугл может узнать о них?

Аватар пользователя charOFF charOFF 19 декабря 2020 в 16:35

А в коде страниц у вас не добавляется случайно тэг <link rel="shortlink" href="/node/*" /> ?
Еще, если у вас раньше были ссылки на node/*, а потом вы их убрали, а страницы закрыли через 404 статус, то гугл может их еще долго помнить и периодически пытаться просканировать.

Аватар пользователя Konstantin Konstantin 19 декабря 2020 в 16:41

в том то и дело, ничего похожего нет, на страницах вообще нет /node/ ни под каким соусом и изначально сайт выкладывался без них, но гугл как то отлавливает такие ссылки, непонятно где, потом робот постоянно их парсит...