сбор контента

Главные вкладки

Аватар пользователя imark imark 5 апреля 2005 в 21:36

как можно автоматизировать сбор контента с других сайтов помимо rss-лент новостей? кажется, это делается каким-то образом с помощью proxy-сервера? или как?

Комментарии

Аватар пользователя Nick Nick 6 апреля 2005 в 10:42

proxy тут не при чем Smile

Если сайт не поддерживает rss, то остается 2 пути:
1. Попрасить админов, чтобы сайт стал поддерживать rss.
2. Самому написать парсер сайта. Готовых нет и вряд ли будут. Т.к. у кажлого сайта свой дизайн, своя структура тэгов => для каждого сайта нужно писать свой парсер. Хотя, это не сложная задача, особенно если научиться управляться с regexp.

--
USU-Lug http://usu-lug.org.ru

Аватар пользователя imark imark 6 апреля 2005 в 10:47

видимо, это "семечки" для программиста. Но, честно говоря, для меня контент-редактора даже слово "парсер" вызывает легкую дрожь в локтях Smile Тем более, когда возникает мысль написать самому парсер. Вероятно, проще будет просто заходить на сайт и брать контент, подписавшись на e-mail рассылку да yandex/subscribe.
Но все равно, спасибо за подсказку ! Smile

Аватар пользователя edhel edhel 6 апреля 2005 в 11:03

Для этого пытаются развивать RDF как формат для обмена контентом в Вебе. Т.е. типа обобщения идеи RSS. Но до реального его применения пока далеко.

Аватар пользователя Гость Гость (не проверено) 13 июня 2006 в 10:54

Ребят,

Помогите, пожалуйта, советом. Где брать электронные открытки и мобильный контент для wap доступа. Хочется автоматизировать процесс.

Спасибо

Сергей