Архитектура Mollom

Главные вкладки

Аватар пользователя vadbars@drupal.org vadbars@drupal.org 16 февраля 2011 в 9:17

Наткнулся на интересную статью об анти-спам системе Mollom, создаваемой под руководством Дриса нашего Байтаерта. Это не совсем о Drupal, но друпалерам должно быть интересно, имхо.

Опубликовано 15 февраля 2011 (http://www.insight-it.ru/masshtabiruemost/arkhitektura-mollom/), автор: Иван Блинков

Mollom — это прибыльный SaaS сервис по фильтрации различных форм спама из контента, сгенерированного пользователями: комментариев, постов на форумах и блогах, опросов, контактных и регистрационных форм. Определение спама основано не только на контенте, но и репутации и прошлой активности разместившего его пользователя. Алгоритм машинного обучения Mollom выполняет роль цифрового модератора 24×7 для более 40 тысяч сайтов, в том числе и очень крупных компаний.

С того момента, как Mollom запустили систему анализа цифрового контента, они выявили более 373 миллионов спам сообщений, обнаружив в процессе что впечатляющие 90% всех прошедших через них сообщений оказались спамом. Весь этот поток спама в 100 сообщений в секунду обрабатывается всего двумя географически распределенными серверами. На каждом из них работает сервер Java-приложений и Cassandra. Так мало ресурсов требуется лишь из-за того, что они создали очень эффективную систему машинного обучения. Разве не круто? Так как же они это делают?

Читать далее

Комментарии