Здравствуйте! Подскажите, есть ли на друпале модуль для автоматического выделения из текста ключевых слов, с возможностью их просмотра и редактирования? Спасибо всем кто ответит!
может я выразился неправильно... Есть статья, нужно определить в ней наиболее часто вастречающиеся слова. Как это можно сделать? Стоит модуль meta tegs, но там что то не то.Ну или я не всё понял.Сразу скажу что я начинающий.
Вообще самый реальный способ анализа, это анализ по уже существующим словарям.
К примеру есть словари с ФИО интересующих лиц, мероприятий, компаний, населённых пунктов и действий. Всё в разных словарях согласно структуре. Нужно каждую новость без тэгов(ключевых слов), по крону, проанализирован на вхождение этих терминов в новости и записать их если они есть. Так же с их синонимами. Всё предельно просто. Мне очень лениво это делать, да и времени на это нет, так бы сделал. Примерно так работают сюжеты на Яндекс новости, Cnews. Ну, я так думаю. Готовые движки есть, но они стоят непомерно дорого. Из более менее похожего http://drupal.org/project/feedapi_taxonomy_compare но работать его мне не удалось заставить.
Более простой способ при работе с ИТ новостями, это анализ вхождения англоязычных слов и пары слова+цифра. Очень простой Regexp. Такой способ работает на пару моих проектов, но минусов очень много, хотя релевантность выдачи очень хорошая, при выдаче по тэгам.
Есть англоязычные проекты их достаточно много. Но они не работают с русским языком.
Комментарии
Есть, "поиск по drupal.ru" называется, на этой неделе как минимум одна такая тема была
Найдёшь как, сообщи. Мне вот очень интересно.
сами то поняли что сказали?
По каким критериям выделяются ключевые слова? По частоте употребления?
может я выразился неправильно... Есть статья, нужно определить в ней наиболее часто вастречающиеся слова. Как это можно сделать? Стоит модуль meta tegs, но там что то не то.Ну или я не всё понял.Сразу скажу что я начинающий.
Это вам нужно самостоятельно с регулярными выражениями мучаться. Вряд ли такое кто-то реализовывал и неизвестно, есть ли в этом вообще смысл.
При этом ключевые слова и мета-тэги - разные вещи. Ключевые слова это термины таксономии.
Вообще самый реальный способ анализа, это анализ по уже существующим словарям.
К примеру есть словари с ФИО интересующих лиц, мероприятий, компаний, населённых пунктов и действий. Всё в разных словарях согласно структуре. Нужно каждую новость без тэгов(ключевых слов), по крону, проанализирован на вхождение этих терминов в новости и записать их если они есть. Так же с их синонимами. Всё предельно просто. Мне очень лениво это делать, да и времени на это нет, так бы сделал. Примерно так работают сюжеты на Яндекс новости, Cnews. Ну, я так думаю. Готовые движки есть, но они стоят непомерно дорого. Из более менее похожего http://drupal.org/project/feedapi_taxonomy_compare но работать его мне не удалось заставить.
Более простой способ при работе с ИТ новостями, это анализ вхождения англоязычных слов и пары слова+цифра. Очень простой Regexp. Такой способ работает на пару моих проектов, но минусов очень много, хотя релевантность выдачи очень хорошая, при выдаче по тэгам.
Есть англоязычные проекты их достаточно много. Но они не работают с русским языком.