von komma4 » Di, 01.10.2013 09:16
Willkommen im Forum.
Machbar ist das - aber sehr aufwändig.
Bspw. geizhals.de blockiert zu viele (wie viele?) Zugriffe innerhalb eines Zeitraums. Gerade durch Probieren festgestellt.
Die Preise selbst sind gut im HTML-Code versteckt, sodass eine "einfache" Verknüpfung zu der HTML-Quelle nicht zur Verfügung steht.
"Das Einfachste", was ich in einem solchen Fall mache, sind automatisierte Screenshots von den Webseiten (innerhalb grosszügig bemessener Zeiträume, die URLs ändern sich da auch sehr oft), mit anschliessendem OCR und parsen durch ein Skript (bash/Python/...)
Ob sich der Aufwand für Dich lohnt?
Willkommen im Forum.
Machbar ist das - aber sehr aufwändig.
Bspw. geizhals.de blockiert zu viele (wie viele?) Zugriffe innerhalb eines Zeitraums. Gerade durch Probieren festgestellt.
Die Preise selbst sind gut im HTML-Code versteckt, sodass eine "einfache" Verknüpfung zu der HTML-Quelle nicht zur Verfügung steht.
"Das Einfachste", was ich in einem solchen Fall mache, sind automatisierte Screenshots von den Webseiten (innerhalb grosszügig bemessener Zeiträume, die URLs ändern sich da auch sehr oft), mit anschliessendem OCR und parsen durch ein Skript (bash/Python/...)
Ob sich der Aufwand für Dich lohnt?