Есть новости, импортируемые аггрегатором. Необходимо для каждой новости автоматически создавать несколько ключевых слов (тагов). Как это можно сделать?
Пока что я реализовал простейший алгоритм, без учёта морфологии и т.п. вещей, - беру из заголовка наугад несколько слов длиннее 3-х символов, не-чисел, не-сокращений. Впринципе работает, но слова получаются не в нормализованном виде (естественно), надо как-то к этому алгоритму прикрутить морфологию.
Гуглем нашёл нечто похожее: "Морфологический разбор слов русского языка", но там на Прологе и Рефале реализовано.
Помогите, подскажите, как такое сделать?