1. Отношу скорее по неопытности.Нужен такой функционал для сайта на Drupal: вытащить и собрать по новой - текст и картинки, без форматирования.
2. Это Perl? Незнакомы...
Пакет poppler (в некоторых дистрибутивах -- poppler-utils).
Этот пакет содержит утилиты: pdftops (конвертер PDF в PostScript), pdfinfo (извлекает информацию о документе из PDF), pdfimages (извлекает изображения из PDF), pdftohtml (конвертер PDF в HTML), pdftotext (конвертер PDF в текст), и pdffonts (анализатор шрифтов PDF).
Комментарии
1. Каким боком вы относите это к Drupal?
2. pdfimages, pdftotext.
1. Отношу скорее по неопытности.Нужен такой функционал для сайта на Drupal: вытащить и собрать по новой - текст и картинки, без форматирования.
2. Это Perl? Незнакомы...
Если вы такой умный то зачем спрашиваете?
Пакет poppler (в некоторых дистрибутивах -- poppler-utils).
Этот пакет содержит утилиты: pdftops (конвертер PDF в PostScript), pdfinfo (извлекает информацию о документе из PDF), pdfimages (извлекает изображения из PDF), pdftohtml (конвертер PDF в HTML), pdftotext (конвертер PDF в текст), и pdffonts (анализатор шрифтов PDF).