Сабж. Имеется сайт на 6 друпале.
Пол года не модерировал. Скопилось пару десятков тысяч комментариев и спама в блогах\на форуме.
Все это в перемешку с основным контентом сайта.
Руками чистить 3500 страниц - не вариант.
Поставил модули mollom, spam, antispam, dubliquate
Сделав анализ спам материалов - пришел к выводу что можно удалить большиство, если отфильтровать
delete duplicate comments - удалить копии комментариев
delete english topiks and blogs
delete comments with links
какие будут идеи по тому что бы отфильтровать эти 3 параметра ?
Комментарии
VBO - там есть действие то ли снять с публикации, то ли удалить "сущности (материалы/комменты), содержащие ключевые слова". Если только первое, то в 2 этапа удалять.
пропарси в комментах теги a href, где есть, убивай
а как выбрать например все комментарии что содержат
a href через sql ?
может быть заодно кто-то подскажет рабочий модуль "жалоб пользователя" который будут приходить админу (списком) на проверку.
на комментарии и ноды (темы форума и блоги)
да, в phpmyadmin, в таблице с коментами воспользуйся поиском - с like% a href. А насчет жалоб - первая ссылка - http://www.drupal.ru/node/78130
ссылки просто руками закрыл в ноуиндекс.
а каким запросом лучше всего отобрать комментарии-дубликаты?
Выбрать повторяющиеся записи