Создание англо-русского словаря

Главные вкладки

Аватар пользователя Verish.Net Verish.Net 18 марта 2010 в 7:30

Приветствую!

Собственно, есть технический, специализированный англо-русский словарь (по гидро- и пневмоприводу, если кому интересно =)), до 20 000 терминов; есть мой сайт на друпале (6.15).

Словарь в формате таком:

air-free безвоздушный, вакуумный; разрежённый
air-in поступающий воздух
air-intake 1. воздухозаборник; входное отверстие воздухопровода 2. впуск воздуха, подвод воздуха
air-lock воздушная пробка
air-locked герметически закрытый, герметичный, воздухонепроницаемый

то есть,

термин_на_английском русский перевод

[есть более сложные термины и их описания, но пока хочется понять как решить эту задачу]

Соответственно, можно ли автоматически (в кошмарном сне вижу вбивать 20 000 нод руками =)):

- импортировать данные в друпал (если надо как-то изменить формат файла, думаю, сделаю);
- сделать, чтобы одна запись была одной нодой;
- также автоматически присвоить ей прямую ссылку, например:

air-free безвоздушный, вакуумный; разрежённый
http://new.verish.net/dictionary/air-free

Вот такой вопрос.

Заранее благодарен за вариант решения вопроса.

P.S. Авторские права не нарушаю, публикую с разрешения правообладателей (мои родные, словарь 20 лет составляли), надеюсь, я быстрее смогу его разместить Smile

Комментарии

Аватар пользователя wolfXXXL wolfXXXL 18 марта 2010 в 11:31

Интересная у Вас задача.
Так с ходу могу лишь предложить:
Не знаю формат файла, но как я понял он электронный значит можно его конвертнуть в HTML и слова у Вас получаться обвернутые в теги
<strong></strong>
перевод нет
конец строки
<br>.
C помощью регулярных выражений может получиться за это как-то зацепиться, или есть в php много интересных функций перевода строки в массив по заданным параметрам.
А дальше
node_save();
тут проблем думаю не будет.
Единственное что б это всё не заглохло на 100 - 200 цикле, нужно это все пропустить через пакетные операции.
Может есть ещё более простое решения пока вижу такое.

Аватар пользователя Verish.Net Verish.Net 18 марта 2010 в 13:29

Спасибо большое Smile

Я никогда с CSV файлами не сталкивался раньше, поэтому и спрашиваю (сейчас буду узнавать что это такое =)).

Данные у меня в простом текстовом файле, то есть - сделать с ним можно в принципе, многое.

Модуль node import я на сайт еще раньше установил, но им не пользовался ни разу, вот и боюсь, ошибиться при "при накате на рабочую базу", если можно так выразиться Smile

Какие "меры предосторожности" стоит учесть? Smile

Аватар пользователя wolfXXXL wolfXXXL 18 марта 2010 в 15:44

"Verish.Net" wrote:
от и боюсь, ошибиться при "при накате на рабочую базу"

Я б Вам советовал вначале все прогнать на локальной базе. И создать перед тем backup.

Аватар пользователя Verish.Net Verish.Net 18 марта 2010 в 16:08

Спасибо за совет, только у меня ее нет...

Единственное, если "нахулиганю", хотя стараюсь этим не злоупотреблять, прошу откатить бакап...

Насколько я понял, готовых решений нет? (вроде модуль такой, алгоритм такой, почитать здесь) Smile

Аватар пользователя wolfXXXL wolfXXXL 18 марта 2010 в 16:32

"Verish.Net" wrote:
Спасибо за совет, только у меня ее нет...

Ну так же если есть доступ к рабочему сайту 30 минут и он будет.
Из легких решений Denwer - локальный сервер
Sypex Dumper - легко и просто сделает backup и если что через него же и восстановите.

Аватар пользователя Verish.Net Verish.Net 18 марта 2010 в 19:06

"wolfXXXL" wrote:
Ну так же если есть доступ к рабочему сайту 30 минут и он будет.
Из легких решений Denwer - локальный сервер
Sypex Dumper - легко и просто сделает backup и если что через него же и восстановите.

Спасибо за совет!

Попробую его реализовать Smile

P.S. Отпишусь потом по результату, если интересно Smile