Активные посетители и статистика сайта (атакует бот яндекса)

Главные вкладки

Аватар пользователя Valeratal Valeratal 21 января 2010 в 11:55

Такой вопрос
есть снипет выводящий разную статистику, в том числе просмотров за 24 часа, кусок кода

$count_pageviews_day = db_fetch_array(db_query('SELECT COUNT(path) AS hits FROM {accesslog} WHERE timestamp >= %d', (time()-86400)));

сейчас показывает 115622

и есть статистика журнала, раздел "Активные посетители"
там я вижу, что посетитель с IP яндекса (77.88.29.246) нагенерировал 23959 хитов

Вопрос у меня такой: правильно ли я понимаю, что бот яндекса обеспечивает около 20% хитов для сайта за последние 24 часа?

Комментарии

Аватар пользователя SORM@drupal.org SORM@drupal.org 21 января 2010 в 12:52

Ага, чем не вариант? Весь день на пролет пытается достучаться до твоего сниппетта ROFL
Как вариант исключить этот IP из статистики и проследить изменения.

Аватар пользователя SORM@drupal.org SORM@drupal.org 21 января 2010 в 13:03

Я думаю, если автор сделает поклоннице задержку, то это, как минимум, прибавит ему в большой степени головной боли, нежели избавит от нее :))))))))))))))
Прошу прощение за излишний сарказм на серьезном сайте Lol

Аватар пользователя Stargazer Stargazer 21 января 2010 в 15:18

Есть еще такая сволочь по имени Punto или libwww по UA строке. Он очень любит сосать трафик и бомбить хиты.

Попробуйте crawl-delay задать в robots.txt или через meta

Quote:

User-agent: Yandex
Crawl-delay: 10

I-m so happy - пример таймаута 10 секунд.

Иногда паукам фиолетово на задержки, смотрите внимательнее логи и куда они стучаться.

Кстати, по поводу пунто, если оно поселится, то не вздумайте блокировать через .htaccess, он будет биться головой об стену и провоцировать 500 c передышками. Может кто знает, что это дрянь? Поговаривают, что под libwww маскирует вредных пауков. На офф страничке написано, что они занимаются коммерческими поисковыми решениями для организаций.

p.s.: сори за офтоп небольшой, нигде не могу ответ найти, а пунто задолбал..