Необходимо реализовать следующий функционал:
забор информации с другого сайта, с последующим созданием статьи с этим контентом в друпале. Например, раз в день будет забираться страница, неким фильтром обрубаються лишние теги (хедер и футер), а потом контент публикуется как статься.
Всё это нужно чтобы на интранет сайте люди могли почитать кое-какие новости из нета, причём доступа к интернету они иметь не будут.
Существуют ли подобные модули или иные методы реализации? Можно конечно банально по крону wget-ом качать страничку, а в друпале поставить статическую ссылку, но хочеться складывать контент централизовано
Комментарии
Без программирования тут не обойтись, раз это не RSS, а произвольный HTML. Модуль будет забирать регулярно контент с заданных urlов, парсить его и сохранять в ноду (см. API по работе с нодами на drupaldocs.org).
Хотя лично мне задача видится надуманной. Легче поставить какой-нибудь прокси (напр. wwwoffle - http://www.gedanken.demon.co.uk/wwwoffle/), который будет ограничивать доступ по URL, глубине вложенности ссылок с них, размерам страниц и пр. т.что юзерам мало не покажется
--
Axel,
www.axel.drupal.ru
ух ты! а как это сделать? что, можно прямо собирать контент с других сайтов? подскажи, как настроить?
так же как браузер - через HTTP/1.1 %]