PDF-Import

Programmierung unter AOO/LO (StarBasic, Python, Java, ...)

Moderator: Moderatoren

marcel_at_work
****
Beiträge: 195
Registriert: Sa, 24.04.2010 15:51
Wohnort: Basel [CH]

PDF-Import

Beitrag von marcel_at_work »

Hey Freunde,

ist es eigentlich irgendwie möglich, Daten (Text) aus einer PDF-Datei via Basic auszulesen? Im Forum gibt´s da gar nix zu und selbst im OOo-Wiki konnte ich nichts dazu finden.

Lg, Marci
[Win 10 Pro x64/Downgrade 7, AOO 4.1.6 und LO 6.3.0.4]
bst
*****
Beiträge: 222
Registriert: Mo, 18.01.2010 16:14
Wohnort: Ilsfeld

Re: PDF-Import

Beitrag von bst »

Morgen,

nimm pdftotext, wandle damit die PDF in eine Textdatei und lies dann diese ein.

Du brauchst dazu http://www.foolabs.com/xpdf/home.html, unter Linux ist das möglicherweise bereits installiert.

cu, Bernd
marcel_at_work
****
Beiträge: 195
Registriert: Sa, 24.04.2010 15:51
Wohnort: Basel [CH]

Re: PDF-Import

Beitrag von marcel_at_work »

Hehe,

danke dir, Bernd.

Ich hab mal gegoogled, aber ein externes Programm dafür zu verwenden, war dann doch ned so ganz das, was ich mir gewünscht habe. Ich hab dies jetzt viel eleganter gelöst: Nach einigem Stöbern bin ich auf "sun-pdfimport.oxt" gestoßen. Dies ist eine OpenOffice.org-Extension in der BETA-Version, die vor kurzem von SUN herausgekommen ist und mit der man PDF-Dateien mittels eines einfachen loadFromUrl-Befehls in Draw öffnen kann. Ist eine echt tolle Erweiterung der OpenOffice-Funktionalitäten und kann man nur weiter empfehlen! ;-)

Lg, Marci
Zuletzt geändert von marcel_at_work am Fr, 18.06.2010 10:43, insgesamt 1-mal geändert.
[Win 10 Pro x64/Downgrade 7, AOO 4.1.6 und LO 6.3.0.4]
bst
*****
Beiträge: 222
Registriert: Mo, 18.01.2010 16:14
Wohnort: Ilsfeld

Re: PDF-Import

Beitrag von bst »

Morgen Marci,

ebenfalls Danke, werde ich mir mal anschauen.

lg, Bernd
hol.sten
******
Beiträge: 871
Registriert: Fr, 18.11.2005 21:21

Re: PDF-Import

Beitrag von hol.sten »

marcel_at_work hat geschrieben:Nach einigem Stöbern bin ich auf "sun-pdfimport.oxt" gestoßen. Dies ist eine OpenOffice.org-Extension in der BETA-Version, die vor kurzem von SUN herausgekommen ist
Vor kurzem? Also den SUN PDF Importer gibt es schon eine ganze Weile.
marcel_at_work hat geschrieben:und mit der man PDF-Dateien mittels eines einfachen loadFromUrl-Befehls in Draw öffnen kann.
Da muss man bei deiner Frage erst mal drauf kommen, dass du mit einem DRAW-Dokument leben kannst, wenn du nach einem Textimport fragst. Eine Textdatei könnte man leicht editieren. In den OOo Draw Dokumenten ist das gar nicht mal so einfach, weil es dort keine Absätze gibt, sondern nur Zeilen.

Außerdem sollte man bedenken, dass der PDF-Import immer wieder mal Probleme macht, wie man z. B. hier nachlesen kann: http://user.services.openoffice.org/en/ ... 47&t=29251
marcel_at_work
****
Beiträge: 195
Registriert: Sa, 24.04.2010 15:51
Wohnort: Basel [CH]

Re: PDF-Import

Beitrag von marcel_at_work »

Hallo hol.sten, ;-)

... für mich ist selbst ein Jahr noch kurz, aber jeder Mensch empfindet dies ja anders. :)

Das mit den Import-Problemen hab ich schon direkt in einer SUN-Doku nachlesen können. Ist aber in meinem Fall nicht von Interesse, da die zu importierenden PDFs stets in einem vorher festgelegten (und von OOo unterstützten) Format vorliegen. Das Format von Text in den Draw-Dokumenten ist zudem auch nicht weiter von Interesse, da ich mich eines Parsers bediene, um nur bestimmte Daten aus den Dateien zu extrahieren.
Desweiteren wollte ich, wie auch schon erwähnt, nicht auf eine externe Anwendung zurückgreifen. Ich habe zwar etwas von DLL-Unterstützung gelesen, habe aber darin keinerlei Kenntnisse.

Wenn das mit der DLL-Schnittstelle zu diesem "pdftotext" allerdings sehr schnell gehen sollte und du mir da auch noch Anwendungstipps geben kannst, hatte ich aber auf jeden Fall ein offenes Ohr dafür. ;-)

Lg, Marci
[Win 10 Pro x64/Downgrade 7, AOO 4.1.6 und LO 6.3.0.4]
Antworten