Индексация мультиязычного контента

Главные вкладки

Аватар пользователя Meowka Meowka 3 июля 2018 в 18:19

Всем доброго времени суток!
Есть интернет-страница на Drupal с включенной мультиязычностью. На странице есть следующие языки: польский, русский, английский и немецкий. Когда создаётся нода, то при её переводе создаётся отдельная нода, которая связана с оригинальной. Т.е.:
domain.com/pl/noda_pl
domain.com/ru/noda_ru
domain.com/en/noda_en
domain.com/de/noda_de

Но проблема заключается в том что noda_pl доступна при просмотре страницы на русском языке, т.е. domain.com/ru/noda_pl и т.д.
Т.е. интерфейс страницы на русском языке, а нода - на польском.
Это как бы не проблема, т.к. такой линк просто не подключается к меню и к кнопкам, но гугл заиндексировал эту страницу. И при переходе с гугла на адрес: domain.com/ru/noda_pl как раз появляется ситуация описанная выше.

Вопрос: как сделать так, чтобы гугл индексировал линки предназначенные для конкретного языка?

Надеюсь максимально понятно изложил ситуацию. Прошу помощи. Спасибо!

Комментарии

Аватар пользователя marassa marassa 3 июля 2018 в 20:10

Meowka wrote:

Когда создаётся нода, то при её переводе создаётся отдельная нода

Это порнография какая-то - неужели в семёрке так это делается?

Meowka wrote:

как сделать так, чтобы гугл индексировал линки предназначенные для конкретного языка?

Если в семёрке нет возможности сделать как в восьмёрке, то мне видятся такие варианты:
1. В robots.txt прописать что-нибудь в плане:
Allow: domain.com/pl/*_pl
Allow: domain.com/ru/*_ru
и т.п., а все нетрадиционные сочетания disallow
Но уже проиндексированные страницы это автоматически из индекса не уберет.
2. Порыться в Google webmaster tools и посмотреть нельзя ли сделать такое же там. Если получится, то по идее ошибочно индексированные страницы должны убраться из индекса.

Аватар пользователя Meowka Meowka 4 июля 2018 в 9:52

marassa wrote:

Это порнография какая-то - неужели в семёрке так это делается?

Да, как-то так.
marassa wrote:

Вот тут кстати более подробно расписано как убрать страницы из Гугла: https://support.google.com/webmasters/topic/4598466?hl=ru

Спасибо за совет! Еще вчера отправил запрос на устранение некоторых ссылок из Гугла.
Вчера заметил, что большая часть заиндексированных ссылок - это ссылки на теги. Один и тот же тег доступен для всех включенных на сайте языков, и нету никакой языковой дифференциации для тегов. Т.е. если тег "tag_pl" первоначально создавался для контента на польском языке, то он будет доступен под адресом domain.com/ru/tag_pl
Под этим же адресом будет интерфейс на русском языке, а контент на польском. Именно такие ссылки индексируются.