Почему в индексе Яндекса страницы только первого уровня?

Главные вкладки

Аватар пользователя treusp treusp 11 июня 2012 в 13:26

Почему-то на моем блоге ngfw.ru в индексе яндекса находятся только страницы сайта первого уровня (/blog, /about...)
И ни одной из /2011/нечто

Исключенные страницы по разделам: http://clip2net.com/clip/m122789/1339406139-clip-12kb.png
Действительно, /2010, /2011, /2012 у меня отсутствуют.

Но внутри-то страницы есть, к примеру, http://ngfw.ru/2012/3d-security-mirror-port-kit
Если глянуть http://ngfw.ru/sitemap.xml (он Яндексу скормлен), там тоже все перечислено.

Хоть на сайте использую поиск Google, но и Яндексовый создал.
И в нем если проверить robots.txt и ту же страницу, все норм, она разрешена.
http://clip2net.com/clip/m122789/1339406461-clip-4kb.png

Как узнать, почему он отказывается индексировать страницы и зачем лезет на /2011 и т.п., если в sitemap.xml они как раз отсутствуют?

Я пробовал руками создать Views с фильтром по годам.
Если дать ему имя /2011v страница показывается. Но стоит обозвать /2011 - пишет "страница не найдена".

Сейчас сделал принудительное перенаправление /2011 на /2011y, но что-то мне это извращением кажется.

Может есть мысли, где ошибка, чтобы не симптомы лечить?

Комментарии

Аватар пользователя EvgenySorokin EvgenySorokin 11 июня 2012 в 16:43

Потому что сайт ваш под АГС фильтром. И друпал тут не виноват.
Больше внимания контенту уделяйте - у вас там одна копипаста, ничего уникального.

Аватар пользователя treusp treusp 11 июня 2012 в 20:28

Спасибо большое за подсказку.
Как можно увидеть, что он под АГС фильтром?

Хотя вообще-то все статьи мои собственные.
Единственное - за прошлые годы я их действительно переносил с другого своего доменного имени.
Может не совсем корректно это сделал (ставил 301 редирект в .htaccess и передавал оригинальный URL, чтобы попадать на ту же самую страничку но уже нового сайта).
Это был сайт chkp.delay.biz, но он в поиске Яндекса не находится, даже если прямо так и ввести.

В любом случае, последние месяцы сразу сюда постил.

Вообще можно здесь продолжить разбирательство или валить в SEO?

К примеру, проверю http://ngfw.ru/2012/3d-security-mirror-port-kit на http://www.content-watch.ru/website/
Вижу: уникальность 63%
Причем основной из приведенных похожих сайтов - http://club.cnews.ru/check+point+software 20.1%
И это именно он с меня статьи дергает.
http://clip2net.com/clip/m122789/1339429970-clip-50kb.png

А все остальные повторения - из серии: "уведомлять меня о новых комментариях отправляя эту форму вы соглашаетесь с политикой приватности mollom"

Многие страницы (непроиндексированные Яндексом) вообще имеют уникальность 100% (например, http://ngfw.ru/2012/R7540)
И даже прошлогодние (перенесенные со старого) тоже 100% (http://ngfw.ru/2011/user_auth)

Впрочем, главный вопрос - что делать? Писать в Яндекс, чтоб сняли?
И, блин, Google то все нормально отрабатывает.

Да, вот еще, есть у меня через аггрегатор ссылки на новости с пары других сайтов.
Но они сделаны как

Т.е. noidex, nofollow, все дела.

Неужто все равно вредит?

Аватар пользователя EvgenySorokin EvgenySorokin 11 июня 2012 в 20:07

Пробуйте пишите в яндекс, но вероятно они отделаются шаблонным ответом что "наши поисковые алгоритмы приняли решение...". Просто так мгновенно никто ничего не снимет.

Что делать - исправлять явные проблемы, хороший контент публиковать, как-то решать проблему с уником (как именно - решать вам. Кто у кого тырит контент - никого не волнует, это реалии).

У меня самого сайт в ноябре тоже под АГС ушел, я сначала думал, что "само вылечится", но нет. На прошлой недели через Адвего проверил все две с лишним сотни страниц, с десяток были не уникальными - удалил без промедления. Плюс сменил шаблон, хотя и на шаблонный, но приятный. В ротабане купил на нескольких площадках баннеры, начал ссылки подкупать. Через месяц где-то попробую в Яндекс написать, может амнистируют.

Так что комплексно подходите.