Семантическая база данных

Главные вкладки

Аватар пользователя Godwin Godwin 14 ноября 2011 в 22:04

Возможно, кто-нибудь даст добрый совет, как создать некую смысловую базу данных. Собираюсь создать сайт (RU-ENG), как информационно-новостной, с блогами. Движок ещё не выбрал, оцениваю Joomla или Drupal. Есть свой сайт на Adobe Dreamweaver CS5, статичный. На новом сайте я хочу структурировать имеющуюся информацию, есть большой объем лекций по разнообразным темам, в областях экономики, политики, религии, космологии, социальных вопросов и т.д., которые нужно классифицировать.

Классифицировать как? У меня есть текстовый HTML архив со страницами лекций. Я бы создал структурированный по категориям раздел: Политика, Экономика, Религия и т.д., куда бы я вставлял только нужные куски текста из лекций, скажем, по типу FAQ. НО (!), и это главное, показанные куски текста физически оставались бы в этих больших лекциях. Фактически, это ссылка на текст, но это уже раскрытый текст в виде законченного смыслового фрагмента из оригинальной лекции. Т.е. мне не надо копировать и вставлять кусок текста, а только показывать кусок оригинала в разделе, где я создаю классификацию.

Общий смысл в том, что меня есть HTML архив, который я постепенно заполняю и продолжаю заполнять. А далее я структурирую этот материал в другом месте.

В идеале, это выглядело бы так: я захожу на свой архив со страницами лекций, выделяю кусок текста и назначаю ему рубрику (раздел) и даю заголовок. Этот кусок текста с заголовком появляется на странице тематического раздела, и добавляется к имеющейся информации. В итоге получается смысловая база данных по лекциям.

Вопрос: можно ли такое создать в Drupal на уровне пользователя, без крутого программирования?

Комментарии

Аватар пользователя Orion76 Orion76 14 ноября 2011 в 22:26

95% - можно :

"Godwin" wrote:
без крутого программирования

Если перенести весь архив в БД друпала...

Есть куча модулей для импорта контента из различных форматов, в том числе и из HTML..

Стандартный тип материала друпала "статья" состоит из Тизера (выдержка из содержимого) и Содержимое..
Тизер выделяется из содержимого как автоматом(кол-во первых символов Содержимого) так и вручную - в 2 клика мышью..

Аватар пользователя Godwin Godwin 14 ноября 2011 в 22:38

"ХулиGUN" wrote:
А что значит крутое программирование?

Я не программист, но простые вещи, по примерам, могу что-то сделать.

"orion76" wrote:
Если перенести весь архив в БД друпала...

А надо переносить HTML страницы в Drupal? Я расчитывал, что Drupal будет вставлять коды (разметки)в HTML.

* * *
Хотелось бы услышать советы, КАК сделать, и какие именно есть возможности по такой классификации.

Аватар пользователя Orion76 Orion76 14 ноября 2011 в 23:17

"Godwin" wrote:
Хотелось бы услышать советы, КАК сделать, и какие именно есть возможности по такой классификации.

Возможности друпала зависят только от "размера" вашего желания..
Я вижу, вы еще слабо в теме, поэтому даже чтобы разговаривать на одном языке, вам необходимо освоить хотябы основы:
Терминологию друпал.
Архитектуру дурпал
и т.д.

Это довольно обширная тема, поэтому гугл в этом больше поможет.. тем более что в инете информации - море, от статей до видео-роликов.

Вот вам список ключевых слов для начала:
drupal видео
drupal для начинающих
drupal быстрый старт
drupal модули
drupal темизация
drupal таксономия
drupal views
drupal cck

Аватар пользователя Orion76 Orion76 15 ноября 2011 в 2:29

"ХулиGUN" wrote:
Тут курить нужно начинать с концепции пхп

Мож всетаки сначало : drupal для начинающих ? -))
чтоб получить хотябы представление о возможностях?

Аватар пользователя Godwin Godwin 25 ноября 2011 в 20:40

Спасибо за советы, но остался главный вопрос: можно ли назначать классификацию на часть текста и отдельно загружать этот текст на другой странице (без копирования и загрузки всей исходной html страницы)? Есть ли плагин, который бы предоставлял возможность делать такую разметку с классификацией в html странице?

Аватар пользователя Orion76 Orion76 26 ноября 2011 в 14:26

"Godwin" wrote:
можно ли назначать классификацию на часть текста и отдельно загружать этот текст на другой странице (без копирования и загрузки всей исходной html страницы)?

Стандартными способами - очень маленькая вероятность, что :
1.кому-то подобный функционал был нужен,
2.Он написал(ему написали) модуль, для реализации данного функционала.
3.Он выложил его в инет.(drupal.org)

Нестандартными способами - сколько угодно
на сегодняшний день известно всего 2-3 задачи, которые невозможно решить при помощи программирования(алгоритма)
.. там что-то про квадратуру круга...
Ваша задача в тот список не входит-))

Аватар пользователя Godwin Godwin 27 ноября 2011 в 17:23

Ваша мысль мне понятна, но для того, чтобы подступиться к этой задаче, мне надо хотя бы понять ход её решения, схему. Даже если я прочту про Друпал от корки до корки, всё равно надо потом понять, КАК решается эта задача.

Ну, например, в инженерном 3D моделировании я работаю уже 22 года, начиная с VAX-VMS на Anvil-4018, самоучка. Могу за один день любого студента научить работать с CATIA 5. Как? Очень просто. Человек должен (сам) иметь свою задачу, что он хочет сделать, любой сложности. Я целый день с ним рядом, и говорю ему сначала схему решения и потом подсказываю каким инструментом и, далее, как решить вдруг возникшую проблему. Т.е. он работает полностью самостоятельно, а я ему только подсказываю. Как правило, на второй день у него вопросов очень мало, человек научился плавать.

Это мой ход мышления, и я не обучаю всем командам системы, как делают сертифицированные дилеры от Dassault Systems. И я также надеюсь, что здесь найдётся опытный спец, который кратко объяснит хотя бы ответ на мой сформулированный выше вопрос.

Аватар пользователя Orion76 Orion76 27 ноября 2011 в 20:00

"Godwin" wrote:
Общий смысл в том, что меня есть HTML архив, который я постепенно заполняю и продолжаю заполнять. А далее я структурирую этот материал в другом месте.

А это обязательное условие, хранить оригиналы в html-формате?

Просто если хранить их непосредственно в виде материалов в БД Друпала, можно избежать кучу лишних сложностей(парсинг html например)..

Аватар пользователя Godwin Godwin 27 ноября 2011 в 22:22

Здесь так называемый архив, транскрипты. Их около полусотни, с внутренними ссылками. Не проблема повозиться и перевести в Друпал, раз надо - так надо, поскольку мне нужен более серьёзный подход в организации информации.

Аватар пользователя Godwin Godwin 28 ноября 2011 в 7:29

Спасибо за информацию про импорт, но честно говоря, я могу сделать даже вручную, сейчас это не критично. Меня интересует принципиальный вопрос, как классифицировать части текста.

У меня есть архив, скажем я его уже внёс в Друпал. В одной большой лекции есть ответы на разные темы. Я создаю отдельный раздел, где у меня есть классифицированная структура (пока пустая). Далее я иду в эту большую лекцию и выделяю куски текста, к какому разделу моей структуры они относятся. Этот кусок текста всплывает в заданном разделе, но не копируется, а загружается. Словом, я делаю в большой лекции разметку по моей классификации.
Лекция - это оригинал, который я не трогаю, но там делаю разметку.

Можно ли найти такой плагин? (не думаю, что такая задача совсем уж уникальная), или, как это можно сделать? (попроще, программирование не потяну). Есть ли какие-то инструменты в Друпал?

Аватар пользователя DennisVV DennisVV 28 ноября 2011 в 10:00

по-моему недавно видел тут обсуждение подобного модуля, хотя могу ошибаться... может поискать по слову "якорь"?

Аватар пользователя Orion76 Orion76 28 ноября 2011 в 11:23

Мое мнение, самый простой вариант.. задействовать модуль book(он имеется в стандартной сборке друпала)

Я так понял, классификацию цитат вы сделали на Таксономии? (модуль Taxonomy)
Если да, то предположим словарь называется Разделы..

Создаете новый тип материала - Цитата
Назначаете ему словарь Разделы

В настройках модуля book указываете типы материалов, которые могут быть использованы в подшивках (Статьи, Цитаты)

Создаете Книгу(элемент Подшивка модуля book)

Добавляете статью в Книгу.
Открываете статью на просмотр
Копируете нужную цитату
Создаете в Стате новую Цитату
Вставляете в нее скопированный текст
Указываете нужный раздел (словаря разделы)
сохраняете.

В итоге должно получиться 2 структуры:
1.Книга(подшивка) Статьи
- Статья 1
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
- Статья 2
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
- Статья 3
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
2.Разделы
-Раздел 1
-- Подраздел 1
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
-- Подраздел 2
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
-- Подраздел 3
-- Цитата 1
-- Цитата 2
-- Цитата 3

-Раздел 2
-- Подраздел 1
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
-- Подраздел 2
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
-- Подраздел 3
-- Цитата 1
-- Цитата 2
-- Цитата 3
-- Цитата N
-- Цитата N

и т.д.

Глубину иерархии, что в Книге что в Разделах можно сделать практически любую.

Модуль book в данном случае используется для связи Статьи с Цитатами, как один из вариантов.

Можно вместо него задействовать модуль CCK + поле Node Reference(поле связи материалов), но так сложнее..

Аватар пользователя Godwin Godwin 28 ноября 2011 в 11:37

Якори? В общих чертах, как их можно использовать для данной задачи? Насколько я знаю, это просто адресация к участку текста. Друпал делает что-то шире?

Аватар пользователя Orion76 Orion76 28 ноября 2011 в 13:05

кстати... вместо типа материала Цитата, для хранения Цитат можно задействовать коментарии к статье.
Прикрутить к коментарию Словарь таксономии(Раздел) для отображения его в нужном раздел небольшая проблема..

Получиться как на этом форуме:

Топик - Статья
Коментарий - Цитата

Выделяете текст в статье, жмете кнопку Вставить Цитату в коментарий
Назначаете коментарию Раздел
Сохраняете
Все

Аватар пользователя Godwin Godwin 28 ноября 2011 в 15:35

"orion76" wrote:
Я так понял, классификацию цитат вы сделали на Таксономии? (модуль Taxonomy)

Нет, пока есть только сами лекции, а как делать классификацию, я только подступаюсь к этой задаче. Большое спасибо orion76 за обстоятельный ответ, есть над чем подумать. В общем я понял, что мне надо в Друпал раскручивать на полную катушку таксономию, найти все возможые модули по ней и создать что-то вроде семантической базы знаний, или как иерархический смысловой словарь, или что-то ещё.

С термином таксономия раньше не сталкивался (ТАКСОНОМИЯ - это теория классификации и систематизации (читаю). Думаю, это то, что надо. Для полноты картины может кто подскажет, какие есть полезные модули по таксономии? Просто по опыту, кто с чем сталкивался. А там глядишь, ценный топик получится. Тема достаточно сложная и полезная, а пока весь мир живёт лишь на механизме поиска.

Аватар пользователя ihappy ihappy 28 ноября 2011 в 17:02

"ХулиGUN" wrote:
Тут курить нужно начинать с концепции пхп

какое нах php?)) html+css = php + js = drupal drupal = js + php = css + html

Аватар пользователя Godwin Godwin 18 января 2012 в 21:51

Осваиваюсь с Друпалом, мне он понравился. Начинаю создавать иерархию сайта. Попробовал разбить свои, упомянутые выше, HTML транскрипты на разные категории, но не получилось, тематика разнообразная. Предложенную выше схему для цитат беру на вооружение, спасибо. Теперь надо классифицировать сами транскрипты. Можно ли создать что-то более гибкое, чем только категории?

Ну, например. Я собираюсь вводить вручную транскрипты, как Страницы, при этом буду указывать Категорию (для этого создам довольно простой, обобщённый список категорий), а внизу на панели создания «Страницы» буду вводить большое количество ключевых слов для данного транскрипта. Вопрос: как мне потом собрать (сделать выборку) всех транскриптов используя список этих ключевых слов? Список ключевых слов нужно показать на отдельной странице, как глоссарий (т.е. как ссылки, в алфавитном порядке)

Я понимаю, что всё звучит довольно банально, но пока пытаюсь понять, как сделать свою таксономию по более гибкой схеме. Может кто предложит свою схему?

Аватар пользователя Orion76 Orion76 19 января 2012 в 7:56

Смысл таксономии не только в возможности построить древовидный каталог,а в том, что материалы можно каталогизировать по каким-либо свойствам.
Например здания

Словарь "Виды":
-Жилые
-Производственные
-Служебные
итд.

Словарь "Материалы стен"
- кирпичные
- деревянные
- соломенные
и т.д.

Словарь "Цвет"
-красные
-синие
-зеленые

Т.е. у каждого материала есть НЕСКОЛЬКО свойств-полей-словарей с выбранными значениями-терминами.

Теперь по каждому словарю можно автоматом построить меню:
Словарь "Материалы стен"
- кирпичные
- деревянные
- соломенные
и при выборе например "кирпичные" отберуться все кирпичные здания.

Можно построить выборки с фильтрами при помощи модуля Views и в последствии в пару-торойку щелчков мыши отбирать например все производственные соломенные здания красного цвета-))

Аватар пользователя Orion76 Orion76 19 января 2012 в 8:03

ЗЫ.. строить выборки views ТОЛЬКО по таксономии - необязательное условие..
можно такжа добавить фильтры по дате публикации, по дате последнего изменения, по авторам, короче практически по любым полям материалов..

Как вы все это организуете зависит только от конкретной задачи и ваших знаний-способностей-фантазии-))

Аватар пользователя Godwin Godwin 19 января 2012 в 10:20

"DennisVV" wrote:
а что такое HTML транскрипты?
Выше где-то я давал ссылку транскрипты. Это распечатки аудиозаписи, которые я перевожу время от времени. А сейчас пытаюсь что-то придумать с их классификацией. В словосочетании «HTML транскрипты» я хотел подчеркнуть, что эти странички в HTML.

* * *
orion76
Ещё раз спасибо за советы. То, что материалы можно каталогизировать по свойствам я видел в уроках, но перечитав ваш пост, меня осенило: а зачем мне переводить транскрипты целиком? Лучше брать отдельный кусок «вопрос/ответ» и присваивать ему несколько свойств. Потом эти куски могут быть виртуально собраны в единый транскрипт по общему заголовку, если нужно для каталога полных транскриптов. Тем более, что этих материалов море, и по имеющемуся времени и по ценности подачи материала было бы лучше выбирать отдельные части, переводить и точнее классифицировать.

Аватар пользователя Godwin Godwin 21 января 2012 в 14:49

В Drupal 7 есть в таксономии словарь "Tags" и есть поле Tags в создании Articles(после поля Body). Мне не понятно, есть ли между ними какая либо взаимосвязь?
Словарь "Tags" я забил своими терминами в ввиде древовидной структуры. А во время создания Articles мне всё время предлагается ввести 3 термина в поле Tags для статьи. Меня немного смущает это совпадение. Какое значение имеет словарь "Tags" в таксономии? Как это связано с SEO?

Аватар пользователя Godwin Godwin 25 января 2012 в 19:58

В дополнении к своему предыдущему посту, хочу спросить: в таксономии словарь "Tags" имеет ли какое-то специальное значение к тэгам? Или его можно использовать произвольным образом?

Аватар пользователя nikola2 nikola2 19 октября 2012 в 13:31

"Godwin везет же Вам. А мне чего то orion76 не помогает. Не знаю по какой причине. Мы проплатили ему деньги месяц назад. А скрипт, который он сделал не работает. И он больше не подходит не на письма, не на мобильник. Мы готов даже добавить скинуться на пиво, можно, бельгийское но хочется что бы orion76 выполнил обязательство или хотя бы уделил нам внимание тоже. Хотя бы скоментировал бы код. Готовы дать заплатить за посредничество. Простите за офтоп"

Аватар пользователя Godwin Godwin 24 октября 2012 в 21:56

"nikola2" wrote:
Godwin везет же Вам. А мне чего то orion76 не помогает...

Я с orion76 не знаком. Почему он пропал для вас, сложно сказать. Все мы люди, бывает что-то происходит. Могу только посоветовать, помолиться за него, пожелать ему добра, и может оказаться так, что все наладится. Бог - это наш Посредник в таких делах.