На главную страницу помещаются новости полученные при помощи feedapi из rss-лент, но эти новости не полные, это только описание, чтобы прочитать новость целиком необходимо перейти на другой сайт, как мне распарсить новости с того сайта? Есть вроде simplepie, но не нашел ничего похожего на настройку парсинга. Или, может, что-нибудь другое подскажете?
Комментарии
PHP вам в руки (получить данные, распапрсить с помощью регулярных выражений, переконвертировать в другую кодировку, вывести). Больше никак. Но как бы парсинг страниц другого сайта - это зло и в отладке и в том что вёрстка меняется на другом сайте и в том что это воровство
И еще, хорошо бы полученные материалы кешировать.
было бы воровство - не отдавали бы.
ну почему же воровство, мне допустим необходимо собирать объявления с нескольких сайтов газет, рсс неполные, а люди которые разместили в этих газетах объявления не будут против если они будут появляться еще где-то.
чем пользоваться? есть ли необходимые функции у simplepie?
кажется появился искомый модуль-аддон к Feed Element Mapper:
feedapi_scraper">http://drupal.org/project/feedapi_scraper]feedapi_scraper[/module] - на неделе ковырну
Irbis: не надо пафоса
Подправил ссылочку feedapi_scraper
выглядит круто,зараза.
вот еще наткнулся querypath - тоже надо покрутить
Ну как, получилось? Расскажите, если не трудно
FORTIS, Вы нашли решение поставленной задаче? Бьюсь с Feeds, Feeds_xpath_parser и feeds_crawler. Саму механику понять не могу..
нет, благополучно забил ) не столь велика необходимость была. а кому очень нужно я думаю за деньги найдут разработчика.
а эти модули не совсем для того
как вариант рабочая связка: dle+rss_grabber парсят, друпал у них забирает