Помогите, как правильно прописать чтобы робот не индексировал ссылки. Я использую модуль Lightbox2 внизу каждой картинки создаются ссылки Оригинал и миниатюра [URL=http://radikal.ru/F/s58.radikal.ru/i162/1105/f0/950bdd484896.png.html][I... .
Я в теме прописал:
.image_size_thumbnail a {
display: none;
}
.image_size__original a {
display: none;
}
И в теме этих ссылок не видно, но робот их все равно видит. gosha.me/node/102?size=_original и gosha/sites/default/files/images/dsc02001.thumbnail.jpg
И еще вопрос есть ссылки, таких ссылок много, а нужны или нет хз??????? они дублируют один и тот же материал gosha.me/node/59?size=preview
И вот такие ссылки gosha.me/user/register?destination=node%2F45%23comment-form тоже несколько штук ????????????????????
Комментарии
Что бы робот не индексировал ссылки - есть специальные атрибуты, например "nofollow" - запрещает поисковым роботам переход по ссылке для её индексирования.
Тыц
я только знаю как задавать чтобы не индексировалась одна страница
в данном случае страница links.html
User-agent: * # относится ко всем роботам
Disallow: /links.html
а можно поконкретней к моим примерам...
Эта запись как бы запретить роботу индексировать все ссылки со знаком вопроса? gosha.me/user/login?destination=comment%2Freply%2F7%23comment-form и gosha.me/node/102?size=_original
gosha.me/image/tid/36?page=1 итд ?
Вот мой
User-agent: *
Crawl-delay: 10
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Allow: /sites/default/files/imce/*
Allow: /sites/default/files/images/*
Disallow: /sites/default/files/soft/*
Disallow: /themes/
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
Disallow: /ext_link?url=
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/
Sitemap: http://www.gosha.me/sitemap.xml
Это для чего? Имело бы смысл, если скажем было бы
Allow: /sites/default/files/imce/*
Allow: /sites/default/files/images/*
Что вы открываете, если оно не закрыто? Каждому [A] должен предшествовать [D] (если о каком-то одном пути речь идёт со всеми хвостами внутри). D - критерий, А - исключение.
Shift-Web, спасибо поправил, а подскажите что еще исправить?
<?phpЭта запись как бы запретить роботу индексировать все ссылки со знаком вопроса? gosha.me/user/login?destination=comment%2Freply%2F7%23comment-form и gosha.me/node/102?size=_original
gosha.me/image/tid/36?page=1 итд ??>
так и есть, там по ссылке
Спасибо. А вот с этим запретом не понятно Disallow: /node$
Это дубль морды. $ - указывает что только этот урл т.е.
http://some_site.some_domain/node
> Disallow: /*?* а это типа запретить индекс страниц со знаком
> вопроса ?
не стоит по такому признаку запрещать
запрещать в роботс.txt можно только ссылку, а не GET параметры
ибо их смысла нет запрещать))
цитата из icq кто что думает?
просто есть шанс, что ваши посетители буду приходить на всякие модуле-зависимые адреса и ставить в последующем сслыку на них же. уберёте модуль, обновите версию, мало ли что ещё и всё.
кроме того, всякие твитеровские и фидбарнеровские переходы дают такую каку.
gosha.me/node/47?size=_original Disallow: /node/?size=_original
gosha.me/node/32?size=preview Disallow: /node/?size=preview
может еще так прописать чтоб выкинуть кучу страниц тока они под цифрами идут каждая страница...
сапа? )))
Может вызвать косяк, если в роботсе
не сапа зло, эти ссылки литбокс создает) не понял напишите плиз полностью как прописать
Вы прикалываетесь?
Disallow: /*?size* так ?
очевидно, что да
не знаю, кто такое мог сказать, но с Яндекс и Google проблем нет. Посмотрел несколько сайтиков, всё нормально.
Это конечно немного по тупому выглядит, но вариант всё же более удачный и простой. Если заморочиться, то можно смело умножить Disallow: /*?size* на 20. Это если модулей не оч много. и до скончания веков ковыряться в соплях подпирая костыли.
{не кошерно}
Crawl-delay: 4
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /filter
Disallow: /scripts/
Disallow: /sites*
Allow: /sites/default/files/imce/*
Allow: /sites/default/files/images/*
Disallow: /sites/default/files/soft/*
Disallow: /libraries*
Disallow: /themes/
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
Disallow: /admin/
Disallow: /comment
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /node$
Disallow: /tracker?
Disallow: /search/
Disallow: /user*
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
Disallow: /search/node*
Disallow: /search/user*
Disallow: /*?*
Disallow: /*?size*
Disallow: /ext_link?url=
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/
Sitemap: http://www.gosha.me/sitemap.xml
Host: www.gosha.me
{кошерно}
Crawl-delay: 4
Disallow: /libraries*
Disallow: /*comment*
Disallow: /includes
Disallow: /profiles
Disallow: /modules
Disallow: /contact
Disallow: /scripts
Disallow: /themes
Disallow: /search
Disallow: /filter
Disallow: /*sort*
Disallow: /*utm_*
Disallow: /misc*
Disallow: /user*
Disallow: /node$
Disallow: /sites
Disallow: /*?*
Allow: /sites/default/files/imce/*
Allow: /sites/default/files/images/*
Sitemap: http://www.gosha.me/sitemap.xml
host: www.gosha.me
....
задумался, там компиляты css лежат, которые боты иногда смотрят. меня не прикрыты поросто и вообще файлы там аплоадовые, не стоит всё же закрывать, но как хотите.
Скриптс я так понимаю тоже можно ушатать, там же девел-инструменты.
Почему вы не закрыли полностью? Disallow: /scripts
это девелоперная примочка для проверки стайл кодинга, не несёт никакой семантически\контентно\опционально важной нагрузки на продакшн сайте. я её удаляю обычно вообще
тоже самое с файлами лицензий, предпочитаю удалять после ознакомления, чтобы корень не хламился ибо туда можно другое складывать иногда.
ну и в итоге если навести марафет, роботс будет понятным, аккуратным и компактным.
Попрвил, убрал txt http://gosha.me/robots.txt
И еще не понятно, звездочки что означают)