Модуль для фильтрации русского мата. RusMat_Filter

19 мая 2011 в 11:43
Аватар пользователя dm66 dm66 0 12

Сделал модуль для фильтрации нецензурных слов.

Модуль пытается определить наличие мата (нецензурных, матерных слов) в тексте.

Заменяет матерные слова на выбранный шаблон, на пример на [censure] (Настраивается).

Поиск осущствляется по алгоритму а не по словарю. Метод обнаружения мата основывается на корнях и предлогах русского языка.

Алгоритм достаточно надежен и быстр, в т.ч. на больших объемах данных.

Автор класса Nasibullin Rinat http://forum.dklab.ru/viewtopic.php?p=136749

Можно настроить на работу в паре с модулем rules.

ВложениеРазмер
Иконка пакета rusmat_filter.zip140.35 КБ

Комментарии

сдается, что это сизифов труд. не с того конца решение проблемы. хотя в каких-то сайтах хорошо бы самые очевидные словосочетания отсечь для начала.

19 мая 2011 в 12:59

Кто захочет написать мат, тот напишет. Не один умный алгоритм не распознает предложение, состоящего из чистого мата.
Но все равно интересно.

30 июня 2011 в 17:58

"haljambaljam" wrote:
Список русского мата для фильтров можно скопировать здесь

Список для наивного модератора. Где тут, например, слово ">|<опа"?

30 сентября 2011 в 13:18

Спасибо, взял себе на вооружения убивать явный мат. Конечно на каждый хитрую гайку найдется свой болт, но мне и не надо что-то 100%.

10 октября 2011 в 15:03

NaZg wrote:
"haljambaljam" wrote:
Список русского мата для фильтров можно скопировать здесь http://kak-v-domashnih-usloviyah.ru/0001/spisok-russkogo-mata.html

бедненько
например или вот[/quote]

Ну и чего из это он не фильтрует? Вы бы сначала попробовали а потом говорили.

20 августа 2012 в 11:32

"dm66" wrote:
Ну и чего из это он не фильтрует? Вы бы сначала попробовали а потом говорили.


вобщем-то много чего пропустил
русский язык очень могуч!

20 августа 2012 в 12:06