Почему-то на моем блоге ngfw.ru в индексе яндекса находятся только страницы сайта первого уровня (/blog, /about...)
И ни одной из /2011/нечто
Исключенные страницы по разделам: http://clip2net.com/clip/m122789/1339406139-clip-12kb.png
Действительно, /2010, /2011, /2012 у меня отсутствуют.
Но внутри-то страницы есть, к примеру, http://ngfw.ru/2012/3d-security-mirror-port-kit
Если глянуть http://ngfw.ru/sitemap.xml (он Яндексу скормлен), там тоже все перечислено.
Хоть на сайте использую поиск Google, но и Яндексовый создал.
И в нем если проверить robots.txt и ту же страницу, все норм, она разрешена.
http://clip2net.com/clip/m122789/1339406461-clip-4kb.png
Как узнать, почему он отказывается индексировать страницы и зачем лезет на /2011 и т.п., если в sitemap.xml они как раз отсутствуют?
Я пробовал руками создать Views с фильтром по годам.
Если дать ему имя /2011v страница показывается. Но стоит обозвать /2011 - пишет "страница не найдена".
Сейчас сделал принудительное перенаправление /2011 на /2011y, но что-то мне это извращением кажется.
Может есть мысли, где ошибка, чтобы не симптомы лечить?
Комментарии
Потому что сайт ваш под АГС фильтром. И друпал тут не виноват.
Больше внимания контенту уделяйте - у вас там одна копипаста, ничего уникального.
Спасибо большое за подсказку.
Как можно увидеть, что он под АГС фильтром?
Хотя вообще-то все статьи мои собственные.
Единственное - за прошлые годы я их действительно переносил с другого своего доменного имени.
Может не совсем корректно это сделал (ставил 301 редирект в .htaccess и передавал оригинальный URL, чтобы попадать на ту же самую страничку но уже нового сайта).
Это был сайт chkp.delay.biz, но он в поиске Яндекса не находится, даже если прямо так и ввести.
В любом случае, последние месяцы сразу сюда постил.
Вообще можно здесь продолжить разбирательство или валить в SEO?
К примеру, проверю http://ngfw.ru/2012/3d-security-mirror-port-kit на http://www.content-watch.ru/website/
Вижу: уникальность 63%
Причем основной из приведенных похожих сайтов - http://club.cnews.ru/check+point+software 20.1%
И это именно он с меня статьи дергает.
http://clip2net.com/clip/m122789/1339429970-clip-50kb.png
А все остальные повторения - из серии: "уведомлять меня о новых комментариях отправляя эту форму вы соглашаетесь с политикой приватности mollom"
Многие страницы (непроиндексированные Яндексом) вообще имеют уникальность 100% (например, http://ngfw.ru/2012/R7540)
И даже прошлогодние (перенесенные со старого) тоже 100% (http://ngfw.ru/2011/user_auth)
Впрочем, главный вопрос - что делать? Писать в Яндекс, чтоб сняли?
И, блин, Google то все нормально отрабатывает.
Да, вот еще, есть у меня через аггрегатор ссылки на новости с пары других сайтов.
Но они сделаны как
Т.е. noidex, nofollow, все дела.
Неужто все равно вредит?
Пробуйте пишите в яндекс, но вероятно они отделаются шаблонным ответом что "наши поисковые алгоритмы приняли решение...". Просто так мгновенно никто ничего не снимет.
Что делать - исправлять явные проблемы, хороший контент публиковать, как-то решать проблему с уником (как именно - решать вам. Кто у кого тырит контент - никого не волнует, это реалии).
У меня самого сайт в ноябре тоже под АГС ушел, я сначала думал, что "само вылечится", но нет. На прошлой недели через Адвего проверил все две с лишним сотни страниц, с десяток были не уникальными - удалил без промедления. Плюс сменил шаблон, хотя и на шаблонный, но приятный. В ротабане купил на нескольких площадках баннеры, начал ссылки подкупать. Через месяц где-то попробую в Яндекс написать, может амнистируют.
Так что комплексно подходите.
Все понял, спасибо!