OCR Text in Tabelle umwandeln

Antwort erstellen


BBCode ist eingeschaltet
[img] ist ausgeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: OCR Text in Tabelle umwandeln

Re: OCR Text in Tabelle umwandeln

von Eddy » Di, 26.06.2012 16:03

Hallo aupex,

Acrobat Reader X (zehn) unter Windows 7 kann PDFs in Word und Excel Dateien konvertieren. Probiere einfach den aktuellen Acrobat Reader.

Re: OCR Text in Tabelle umwandeln

von aupex » Di, 26.06.2012 15:13

Hallo,
Sorry vergesse ich immer wieder...
OS ist Win Vista.
Benutze im moment Acrobat 7.

Re: OCR Text in Tabelle umwandeln

von Eddy » Di, 26.06.2012 13:52

Hallo aupex,
aupex hat geschrieben:Wie kann ich diesen Text formatiert einfügen?
über die Zwischenablage mit Strg+v?

Mit der passenden Extension kannst Du PDFs in OO/LO öffnen.

Füge erst in den Writer ein, dort kannst Du den Text nach meiner Meinung besser bearbeiten.

Wenn wir wüssten, mit welchem Betriebssystem Du arbeitest, könnten wir Dir möglicherweise zu geeigneteren PDF Readern raten. Oder zu anderem Vorgehen.
Der Adobe Reader X z.B. kann PDFs in Word oder Excel Dokumente wandeln.

Mit eingefügten Grüßen

Eddy

Re: OCR Text in Tabelle umwandeln

von aupex » Di, 26.06.2012 12:52

Hallo,

Danke erstmal.

Ich benutze FreeOCR. Keine Einstellmöglichkeit gefunden.
Eine Regel definieren ist leider nicht möglich, da es Artikelbez. mit einem oder mehreren Wörtern gibt.
Das PDF ist kein gescanntes Dokument sondern auswählbarer Text. (hätte ich ja auch draufkommen können).
Wie kann ich diesen Text formatiert einfügen?

Gruss

Re: OCR Text in Tabelle umwandeln

von Karolus » Di, 26.06.2012 12:27

Hallo

Ich sehe da kein verlässliches Muster welches der Leerzeichen nun keinen Spaltentrenner representiert - kannst du eine Regel definieren nach der $Software trennt/nicht_trennt ??

Ps.Was kann dein OCR ? - kannst du dort evtl. einstellen das die "Spalten" aus dem .pdf mit Tabulator statt Leerzeichen getrennt werden ?

Karo

Re: OCR Text in Tabelle umwandeln

von Eddy » Di, 26.06.2012 12:11

Hallo aupex,
aupex hat geschrieben: (PDF Format) mit einem OCR in Text umzuwandeln.
warum das? Ist das ein "aus einem Scan" (Grafik) generiertes PDF? Wenn nicht, liegen die Daten als Text vor und Du kannst den Text direkt erhalten.
aupex hat geschrieben:Gibt es eine andere Möglichkeit als alles von Hand einzutragen?
Möglicherweise. Im Writer mit Bearbeiten > Auswahlmodus > Blockbereich passend markieren und danach mit Suchen und Ersetzrn die Leerzeichen gegen z.B. den Unterstrich tauschen.

Mit ausgetauschten Grüßen

Eddy

OCR Text in Tabelle umwandeln

von aupex » Di, 26.06.2012 11:47

Hallo,

Ich bin gerade dabei die Rechnungen meines Lieferanten (PDF Format) mit einem OCR in Text umzuwandeln.
Jetzt möchte ich diesen Text in einer Tabelle einfügen. Natürlich in Spalten wie z.b. Art.Nr., Menge, EK-Preis, VK, usw.
Leider ist der Text nicht per Komma o.ä. getrennt (Siehe Beispiel). Wenn ich nach Leerzeichen Trenne wird im unteren Beispiel "Marlboro" und "Hülsen" in 2 Spalten gepackt.
Gibt es eine andere Möglichkeit als alles von Hand einzutragen?

Gruss


Beispielzeile aus der OCR-Ausgabe

4041 1 KAR 5 200er Pg 970923 Marlboro Hülsen Gold ?,??? 4,00 19,00 1,80 9,00
4051 1 KAR 5 200er Pg 970930 Marlboro Hülsen Red ?,??? 4,00 19,00 1,80 9,00

Die ??? sind mein EK-Preis

Nach oben