Граббер контетнта с сайта

Главные вкладки

Комментарии

Аватар пользователя adubovskoy adubovskoy 6 декабря 2009 в 3:52

существует. Он находится на полке между искусственным интеллектом и сферическим конем. Возможно вас еще заинтересует таблетка бессмертия и амулет "Москва без пробок".

Чаще всего парсеры пишутся под сайт, либо под cms'ку; есть ряд конструкторов где в конфигах пишете в каких тегах располагается нужный вам контент и это аккуратно кладется в табличку. Но универсального решения нет и не будет. Рекомендую гуглить и пробовать, отбирая то что именно вам под ваши цели удобней.

p.s. а вообще - сайты, которые лояльны к передаче контента имеют свои механизмы экспорта. А парсинг других сайтов сильно смахивает на пиратство. Поверьте - это плохой способ начинать дела, если вы хотите вырасти в "большой и серьезный сайт".

Аватар пользователя volocuga volocuga 6 декабря 2009 в 13:43

"adubovskoy" wrote:
Поверьте - это плохой способ начинать дела, если вы хотите вырасти в "большой и серьезный сайт".

Давайте без нравоучений Smile Если есть контент на сайте в свободном доступе,его можно брать,так как контент-он же для людей Smile

http://www.diffbot.com/apps/feedbeater - довольно юзабельный граббер html->rss

Вот чувак описывает аналогичные сервисы (на английском)

Аватар пользователя flecus flecus 6 декабря 2009 в 15:43

"volocuga" wrote:
Давайте без нравоучений Smile Если есть контент на сайте в свободном доступе,его можно брать,так как контент-он же для людей :)

Контент, размещенный на сайте, защищен копирайтами. Кроме того, воровать его бесполезно с точки зрения СЕО - в лучшем случае поисковики его не будут индексировать, а в худшем - забанят сайт вора, особенно если когда законный владелец контента пожалуется об этом Платону Щукину и в соответсвующую службу Гугла.

Аватар пользователя volocuga volocuga 6 декабря 2009 в 17:24

"flecus" wrote:
Контент, размещенный на сайте, защищен копирайтами.

Вы же не знаете,возможно он копирайт поставит Smile
Случаи разные бывают,если я вебкамеру сграбил,на которой ватермарк стоит первоисточника,то кто я - вор или рекламирую сайт первоисточника? Smile

Grabber - это c аглийского "рвач",не вор Smile

С "точки зрения СЕО" конечно,лучше заплатить студенту копирайтеру за бездарній текст с ключевиками Smile