Seite 1 von 1
PDF-Import
Verfasst: Mi, 16.06.2010 23:06
von marcel_at_work
Hey Freunde,
ist es eigentlich irgendwie möglich, Daten (Text) aus einer PDF-Datei via Basic auszulesen? Im Forum gibt´s da gar nix zu und selbst im OOo-Wiki konnte ich nichts dazu finden.
Lg, Marci
Re: PDF-Import
Verfasst: Do, 17.06.2010 08:31
von bst
Morgen,
nimm pdftotext, wandle damit die PDF in eine Textdatei und lies dann diese ein.
Du brauchst dazu
http://www.foolabs.com/xpdf/home.html, unter Linux ist das möglicherweise bereits installiert.
cu, Bernd
Re: PDF-Import
Verfasst: Fr, 18.06.2010 10:10
von marcel_at_work
Hehe,
danke dir, Bernd.
Ich hab mal gegoogled, aber ein externes Programm dafür zu verwenden, war dann doch ned so ganz das, was ich mir gewünscht habe. Ich hab dies jetzt viel eleganter gelöst: Nach einigem Stöbern bin ich auf "sun-pdfimport.oxt" gestoßen. Dies ist eine OpenOffice.org-Extension in der BETA-Version, die vor kurzem von SUN herausgekommen ist und mit der man PDF-Dateien mittels eines einfachen loadFromUrl-Befehls in Draw öffnen kann. Ist eine echt tolle Erweiterung der OpenOffice-Funktionalitäten und kann man nur weiter empfehlen!
Lg, Marci
Re: PDF-Import
Verfasst: Fr, 18.06.2010 10:39
von bst
Morgen Marci,
ebenfalls Danke, werde ich mir mal anschauen.
lg, Bernd
Re: PDF-Import
Verfasst: Fr, 18.06.2010 23:16
von hol.sten
marcel_at_work hat geschrieben:Nach einigem Stöbern bin ich auf "sun-pdfimport.oxt" gestoßen. Dies ist eine OpenOffice.org-Extension in der BETA-Version, die vor kurzem von SUN herausgekommen ist
Vor kurzem? Also den SUN PDF Importer gibt es schon eine ganze Weile.
marcel_at_work hat geschrieben:und mit der man PDF-Dateien mittels eines einfachen loadFromUrl-Befehls in Draw öffnen kann.
Da muss man bei deiner Frage erst mal drauf kommen, dass du mit einem DRAW-Dokument leben kannst, wenn du nach einem Textimport fragst. Eine Textdatei könnte man leicht editieren. In den OOo Draw Dokumenten ist das gar nicht mal so einfach, weil es dort keine Absätze gibt, sondern nur Zeilen.
Außerdem sollte man bedenken, dass der PDF-Import immer wieder mal Probleme macht, wie man z. B. hier nachlesen kann:
http://user.services.openoffice.org/en/ ... 47&t=29251
Re: PDF-Import
Verfasst: Sa, 19.06.2010 14:32
von marcel_at_work
Hallo hol.sten,
... für mich ist selbst ein Jahr noch kurz, aber jeder Mensch empfindet dies ja anders.
Das mit den Import-Problemen hab ich schon direkt in einer SUN-Doku nachlesen können. Ist aber in meinem Fall nicht von Interesse, da die zu importierenden PDFs stets in einem vorher festgelegten (und von OOo unterstützten) Format vorliegen. Das Format von Text in den Draw-Dokumenten ist zudem auch nicht weiter von Interesse, da ich mich eines Parsers bediene, um nur bestimmte Daten aus den Dateien zu extrahieren.
Desweiteren wollte ich, wie auch schon erwähnt, nicht auf eine externe Anwendung zurückgreifen. Ich habe zwar etwas von DLL-Unterstützung gelesen, habe aber darin keinerlei Kenntnisse.
Wenn das mit der DLL-Schnittstelle zu diesem "pdftotext" allerdings sehr schnell gehen sollte und du mir da auch noch Anwendungstipps geben kannst, hatte ich aber auf jeden Fall ein offenes Ohr dafür.
Lg, Marci