Apache Solr Attachments

Главные вкладки

Аватар пользователя andreystrelkov andreystrelkov 20 февраля 2013 в 22:49

Здравствуйте товарищи, у себя на работе делаю сайт, к которому хочу подключить поисковый движок Apache Solr, ибо будет много записей, разных типов, разных пользователей, и порой нужно будет находить их.
Как делал, на сервере установил Drupal, поставил модуль Apache Solr Integration, теперь нужно запустить так сказать службу Apache Solr, для чего нужно установить Java, и скопировать куда нибудь, допустим на C:\apachesolr\... - сам Solr.

Но на сервере крутятся другие задачи и приложения, которым нашиш Java не нужна, и поэтому мне туда ради моего какого то поискового движка - Java ставить не будут, есть подозрение, что из за неё можно нагрузить лишний раз сервак, да и опасно, мало ли себя как нибудь странно повёдет, а задачи крутятся достаточно сложные и опасные, поэтому сделали по другому, создали виртуальную машину, ибо с ними всё проще, и туда спокойно поставили Java, и скопировали Solr. Апосля чего запустил start.jar, и процесс в 25мб заработал Smile

Пропинговал виртуалку, она мне выдала например 192.168.1.1
В настройках localhost server (который по умолчанию в модуле solr) установил адрес сервака Solr: 192.168.1.1:8983/solr

Та да! Сервак говорит найдён, всё гуд! Даже сам удивился Smile
Насоздавал нод, запустил индексирование, всё шустренько проиндексировалось. И самое главное ищется всё гуд Smile

Теперь настала вторая задача!

Обязательно нужно Apache Solr Attachments, ибо документов тоже до фигища будет Smile
Установил модуль, появилась вкладка дополнительная, где спрашивает форматы для индексации (или пропуска индексации, не помню, не суть)
Каким способ обрабатывать файл - Библиотекой Tika (локального местонахождения)
либо Solr (дистанционным), а ниже пишут мол библиотекой то шустрее будет (видать базовой tika у solr-а - по слабее будет)

ну я как диловой давай Tika библиотекой, а она ниже - указывай полный путь, я конечно сначала сходил скачал этот файл, последней версии 1.3 в 26мб гдето
но вот туплю... тепере че!

а куда его помещать, и куда вообще лучше, что имеется ввиду локально?
в директорию сайта куда нибудь, либо вообще левое какое нибудь место на серваке, или может вообще на виртуалку, где в принципе Java стоит, и где он в принципе и должен запускаться,
если на виртуалке, то подскажите пожалуйста как должен примерно путь до него выглядеть?