как можно автоматизировать сбор контента с других сайтов помимо rss-лент новостей? кажется, это делается каким-то образом с помощью proxy-сервера? или как?
Если сайт не поддерживает rss, то остается 2 пути:
1. Попрасить админов, чтобы сайт стал поддерживать rss.
2. Самому написать парсер сайта. Готовых нет и вряд ли будут. Т.к. у кажлого сайта свой дизайн, своя структура тэгов => для каждого сайта нужно писать свой парсер. Хотя, это не сложная задача, особенно если научиться управляться с regexp.
видимо, это "семечки" для программиста. Но, честно говоря, для меня контент-редактора даже слово "парсер" вызывает легкую дрожь в локтях Тем более, когда возникает мысль написать самому парсер. Вероятно, проще будет просто заходить на сайт и брать контент, подписавшись на e-mail рассылку да yandex/subscribe.
Но все равно, спасибо за подсказку !
Комментарии
proxy тут не при чем
Если сайт не поддерживает rss, то остается 2 пути:
1. Попрасить админов, чтобы сайт стал поддерживать rss.
2. Самому написать парсер сайта. Готовых нет и вряд ли будут. Т.к. у кажлого сайта свой дизайн, своя структура тэгов => для каждого сайта нужно писать свой парсер. Хотя, это не сложная задача, особенно если научиться управляться с regexp.
--
USU-Lug http://usu-lug.org.ru
видимо, это "семечки" для программиста. Но, честно говоря, для меня контент-редактора даже слово "парсер" вызывает легкую дрожь в локтях Тем более, когда возникает мысль написать самому парсер. Вероятно, проще будет просто заходить на сайт и брать контент, подписавшись на e-mail рассылку да yandex/subscribe.
Но все равно, спасибо за подсказку !
Для этого пытаются развивать RDF как формат для обмена контентом в Вебе. Т.е. типа обобщения идеи RSS. Но до реального его применения пока далеко.
Ребят,
Помогите, пожалуйта, советом. Где брать электронные открытки и мобильный контент для wap доступа. Хочется автоматизировать процесс.
Спасибо
Сергей