Hallo,
Ich bin gerade dabei die Rechnungen meines Lieferanten (PDF Format) mit einem OCR in Text umzuwandeln.
Jetzt möchte ich diesen Text in einer Tabelle einfügen. Natürlich in Spalten wie z.b. Art.Nr., Menge, EK-Preis, VK, usw.
Leider ist der Text nicht per Komma o.ä. getrennt (Siehe Beispiel). Wenn ich nach Leerzeichen Trenne wird im unteren Beispiel "Marlboro" und "Hülsen" in 2 Spalten gepackt.
Gibt es eine andere Möglichkeit als alles von Hand einzutragen?
Gruss
Beispielzeile aus der OCR-Ausgabe
4041 1 KAR 5 200er Pg 970923 Marlboro Hülsen Gold ?,??? 4,00 19,00 1,80 9,00
4051 1 KAR 5 200er Pg 970930 Marlboro Hülsen Red ?,??? 4,00 19,00 1,80 9,00
Die ??? sind mein EK-Preis
OCR Text in Tabelle umwandeln
Moderator: Moderatoren
Re: OCR Text in Tabelle umwandeln
Hallo aupex,
Mit ausgetauschten Grüßen
Eddy
warum das? Ist das ein "aus einem Scan" (Grafik) generiertes PDF? Wenn nicht, liegen die Daten als Text vor und Du kannst den Text direkt erhalten.aupex hat geschrieben: (PDF Format) mit einem OCR in Text umzuwandeln.
Möglicherweise. Im Writer mit Bearbeiten > Auswahlmodus > Blockbereich passend markieren und danach mit Suchen und Ersetzrn die Leerzeichen gegen z.B. den Unterstrich tauschen.aupex hat geschrieben:Gibt es eine andere Möglichkeit als alles von Hand einzutragen?
Mit ausgetauschten Grüßen
Eddy
Zuletzt geändert von Eddy am Di, 26.06.2012 12:35, insgesamt 1-mal geändert.
Re: OCR Text in Tabelle umwandeln
Hallo
Ich sehe da kein verlässliches Muster welches der Leerzeichen nun keinen Spaltentrenner representiert - kannst du eine Regel definieren nach der $Software trennt/nicht_trennt ??
Ps.Was kann dein OCR ? - kannst du dort evtl. einstellen das die "Spalten" aus dem .pdf mit Tabulator statt Leerzeichen getrennt werden ?
Karo
Ich sehe da kein verlässliches Muster welches der Leerzeichen nun keinen Spaltentrenner representiert - kannst du eine Regel definieren nach der $Software trennt/nicht_trennt ??
Ps.Was kann dein OCR ? - kannst du dort evtl. einstellen das die "Spalten" aus dem .pdf mit Tabulator statt Leerzeichen getrennt werden ?
Karo
LO7.4.7.2 debian 12(bookworm) auf Raspberry5 8GB (ARM64)
LO25.2.3.2 flatpak debian 12(bookworm) auf Raspberry5 8GB (ARM64)
LO25.2.3.2 flatpak debian 12(bookworm) auf Raspberry5 8GB (ARM64)
Re: OCR Text in Tabelle umwandeln
Hallo,
Danke erstmal.
Ich benutze FreeOCR. Keine Einstellmöglichkeit gefunden.
Eine Regel definieren ist leider nicht möglich, da es Artikelbez. mit einem oder mehreren Wörtern gibt.
Das PDF ist kein gescanntes Dokument sondern auswählbarer Text. (hätte ich ja auch draufkommen können).
Wie kann ich diesen Text formatiert einfügen?
Gruss
Danke erstmal.
Ich benutze FreeOCR. Keine Einstellmöglichkeit gefunden.
Eine Regel definieren ist leider nicht möglich, da es Artikelbez. mit einem oder mehreren Wörtern gibt.
Das PDF ist kein gescanntes Dokument sondern auswählbarer Text. (hätte ich ja auch draufkommen können).
Wie kann ich diesen Text formatiert einfügen?
Gruss
Re: OCR Text in Tabelle umwandeln
Hallo aupex,
Mit der passenden Extension kannst Du PDFs in OO/LO öffnen.
Füge erst in den Writer ein, dort kannst Du den Text nach meiner Meinung besser bearbeiten.
Wenn wir wüssten, mit welchem Betriebssystem Du arbeitest, könnten wir Dir möglicherweise zu geeigneteren PDF Readern raten. Oder zu anderem Vorgehen.
Der Adobe Reader X z.B. kann PDFs in Word oder Excel Dokumente wandeln.
Mit eingefügten Grüßen
Eddy
über die Zwischenablage mit Strg+v?aupex hat geschrieben:Wie kann ich diesen Text formatiert einfügen?
Mit der passenden Extension kannst Du PDFs in OO/LO öffnen.
Füge erst in den Writer ein, dort kannst Du den Text nach meiner Meinung besser bearbeiten.
Wenn wir wüssten, mit welchem Betriebssystem Du arbeitest, könnten wir Dir möglicherweise zu geeigneteren PDF Readern raten. Oder zu anderem Vorgehen.
Der Adobe Reader X z.B. kann PDFs in Word oder Excel Dokumente wandeln.
Mit eingefügten Grüßen
Eddy
Re: OCR Text in Tabelle umwandeln
Hallo,
Sorry vergesse ich immer wieder...
OS ist Win Vista.
Benutze im moment Acrobat 7.
Sorry vergesse ich immer wieder...
OS ist Win Vista.
Benutze im moment Acrobat 7.
Re: OCR Text in Tabelle umwandeln
Hallo aupex,
Acrobat Reader X (zehn) unter Windows 7 kann PDFs in Word und Excel Dateien konvertieren. Probiere einfach den aktuellen Acrobat Reader.
Acrobat Reader X (zehn) unter Windows 7 kann PDFs in Word und Excel Dateien konvertieren. Probiere einfach den aktuellen Acrobat Reader.