Наткнулся на интересную статью об анти-спам системе Mollom, создаваемой под руководством Дриса нашего Байтаерта. Это не совсем о Drupal, но друпалерам должно быть интересно, имхо.
Опубликовано 15 февраля 2011 (http://www.insight-it.ru/masshtabiruemost/arkhitektura-mollom/), автор: Иван Блинков
Mollom — это прибыльный SaaS сервис по фильтрации различных форм спама из контента, сгенерированного пользователями: комментариев, постов на форумах и блогах, опросов, контактных и регистрационных форм. Определение спама основано не только на контенте, но и репутации и прошлой активности разместившего его пользователя. Алгоритм машинного обучения Mollom выполняет роль цифрового модератора 24×7 для более 40 тысяч сайтов, в том числе и очень крупных компаний.
С того момента, как Mollom запустили систему анализа цифрового контента, они выявили более 373 миллионов спам сообщений, обнаружив в процессе что впечатляющие 90% всех прошедших через них сообщений оказались спамом. Весь этот поток спама в 100 сообщений в секунду обрабатывается всего двумя географически распределенными серверами. На каждом из них работает сервер Java-приложений и Cassandra. Так мало ресурсов требуется лишь из-за того, что они создали очень эффективную систему машинного обучения. Разве не круто? Так как же они это делают?
Комментарии
нейронная сеть- чему удивляться. молодцы
Еще есть интеграция с друпалом от Дриса: mollom
насколько знаю mollom это его детище