RSS парсер

Главные вкладки

Аватар пользователя alex-chz alex-chz 26 октября 2010 в 18:35

Избитая тема... Ищу парсер. Нужно чтоб полностью грабил новости - т.е открывал тизер - переходил по ссылке и грабил все что находится между указанными мною тегами. Есть ли такие? тем видел много, ответов в них стоящих так и не заметил. Может не обратил внимания. Подскажите какой модуль справится с подобной задачей - нужны только бесплатные (можно просто классы в крайнем случае, написанные на РНР). Для DLE я такой нашел, для Drupala хоть убейте, не заметил... Самому садиться писать не очень хочется, но че то кажется, что придется.. Вобщем, пока штудирую регулярки, жду ответов от форумчан... спасибо всем за ответы Smile

Комментарии

Аватар пользователя Alex Bacart Alex Bacart 26 октября 2010 в 20:09

Сам еще не задавался этой темой, но знаю, что однажды займусь "грабежом" ))
Также, как и Вы не находил хороших "грабителей" (если честно, то и плохих не находил))
Встречный вопрос - на чем писать планируете, если не найдете?

ЗЫ: когда напишу свой - поделюсь с сообществом ))

Аватар пользователя alex-chz alex-chz 26 октября 2010 в 20:22

уже почти написал - он берет тизер RSS, и по ссылке что в нем находится переходит и грабит от и ДО (вот только щас у меня проблемка с ДО)... предполагаю что мое решение пока что очеень примитивно, но для меня оно пока что подходит.. Хотелось просто готовое решение взять - мне завтра нужно показывать проект, так что чувствую, что бессонная ночь обеспечена..

Аватар пользователя alex-chz alex-chz 26 октября 2010 в 20:33

О, только написал и сразу нашел причину, почему не работало "ДО". Ура, грабилку написал)). Как появится немного свободного времени, могу ее сделать универсальной и выложить на общий суд. Пишу на РНР=)

Аватар пользователя alex-chz alex-chz 27 октября 2010 в 1:32

"Vydrin_AP" wrote:

Буду ждать с нетерпением )) отпишитесь сюда, как выложите плиз, чтобы сразу в трекере было видно..

Оки, постараюсь =). У меня просто столько работы, что просто с ума можно сойти (я немного нагавнокодил в граббере - щас для меня скорость написания превыше всего, вот утром, если буду успевать, уберу гавнокод перед показом проекта заказчику xD).. как только немного разгружусь, приведу граббер в норм вид и выложу)

Аватар пользователя UnnamedNETUA UnnamedNETUA 27 октября 2010 в 10:06

Я себе уже создал ленту из 4 сайтов.
Половина сайтов отдает полный контент, но тегом для яндекса, поэтому только его переименовать и все ^_^.
Теперь проблема, модуль feeds дублирует контент Sad