Seite 2 von 2

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:59
von Karolus
Hallo

.csv ist purer Text, du musst lediglich den Dateinamen ändern von blah.txt auf blah.csv

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 10:00
von nikki
Hallo,
ob .txt- oder .csv-Datei ist einerlei. Beides sind Textdateien die sich nur in der Dateiendung unterscheiden. Stattdessen kommt es auf den Inhalt an.

Wenn Du z.B. eine .txt-Datei mit dem korrekten Inhalt hast, brauchst Du nur die Dateiendung .txt durch .csv zu ersetzen.

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 10:04
von Stephan
und dort ja schaff ich es auch nicht, eine buchung in eine zeile zu kriegen
mit dem Assistenten nicht, aber dass geht doch per Formel,z.B.:

kopiere den Text (siehe zweites Textbeispiel in DEinem post vom 15.04.15 9:03 ) in "Tabelle1" in die Spalte A
schreibe in "Tabelle2" in Zelle A1 die Formel: =WENN(LINKS(Tabelle2.A2;12)="Überw./Zahl.";Tabelle2.A1&Tabelle2.A2;"")

ziehe diese Formel beliebig weit nach unten

jede zweite Zeile ist nun leer, deswegen sortiere z.B. aufsteigend und alle Zeilen mit Inhalt stehen untereinander und jede Zeile enthält nun einen Buchungssatz


Ich sehe allerdings nicht das das das Problem schon nennenwert löst, denn die Buchungssätze enthalten keine Trenner anhand derer man die einzelnen FElder leicht aufteilen könnte.


Gruß
Stephan

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 10:46
von swinit
hey super, die antwort war aufjedenfall so dass ich echt voran gekommen bin, an sich hat es soweit geklappt, allerdings nervt lexware jetz nur noch.....aber es sieht bisher sehr gut aus, alles in einer zeile mit feldtrennern klappts dann auch....danke aufjedenfall

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 11:01
von swinit
das euro zeichen ist nur irgendwie weg, also wird nicht mitgenommen? wie ergänze ich da die formel?

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 11:15
von Stephan
mit feldtrennern klappts dann auch
Wie denn?

Ich hatte doch bereits geschrieben das ich dafür nun gerade keine (einfache) Lösung sehe, so wie die Daten vorliegen.
wie ergänze ich da die formel?
Garnicht, denn die Formel 'verschluckt' keine Eurozeichen, sondern kopiert/kombiniert stur den vorhandenen Text. Wenn Eurozeichen fehlen dann weil sie schon im Ausgangstext fehlen (also dem Text der in "Tabelle1" kopiert wurde).

Der Beispieltext von Dir enthält z.B. keine Eurozeichen und darüber hinaus entzieht es sich meiner Kenntnis warum das so ist, denn wenn dieser Text zunächst aus einem PDF durch Umwandlung erzeugt wurde hatte ich ja bereits genau auf solche Probleme hingewiesen:

"die Schwierigkeit liegt insbesondere auch darin das bei der Konvertierung einzelne Zeichen/Zahlen verstümmelt/verändert werden [können]"



Gruß
Stephan

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Do, 16.04.2015 08:14
von Hiker
Hallo,
swinit hat geschrieben:problem is einfach, ich kann die pdf nicht als csv direkt umwandeln, sonst wäre alles einfacher,
.....
ich dachte halt, ob man so den zwischenschritt programmieren könnte, was mein kollege vorschlug....naja egal
der pdf2txt.Konverter bringt dir halt nur die Buchstaben wieder in eine lesbare Reihenfolge, dekodiert nebenbei komprimierte Segmente und wirft
alles weg, was nur Anweisungen für das Layout sind (Schriftarten....).
Wenn Du Lust hast, öffne mal Deine PDF-Datei mit einem Texteditor und such dann (per Suchfunktion) nach einem der ersten
Buchungstexte. Wenn Du Ihn findest, hast Du eine Vorstellung, was die Ausgangsbasis ist.

Wenn Du den Text nicht findest (wie Ich bei meiner Tabelle über E10-Verträglichkeit bei Automarken) müsstest Du via

Code: Alles auswählen

pdftk Kontoauszug.pdf output plain.txt uncompress
den Text erstmal dekomprimieren (hab ich kurz ergoogelt siehe:
http://www.heise.de/security/artikel/Ta ... kelseite=2 )

Eine sinnvolle Konvertierung nach csv müsste die Struktur in der pdf-Datei erkennen, etwas was nicht ganz trivial ist und auch in Python mehr als ein paar Zeilen braucht - denn ein einfaches Regelwerk kann ich in Deinen Beispielen nicht erkennen.
Einige OCR-Programme bringen inzwischen recht ordentliche Tabellenerkennungen mit - evtl versuchst Du es mal mit eine Testversion von Finereader oder Omnipage - wenn es denn eine gibt. Lohnen tut sich der Aufwand aber meist erst, wenn man das mehr als einmal braucht. Immerhin kann man Dort meist einmal die Tabelle auf der ersten Seite einrichten und dann die Folgeseiten in dieselbe Tabelle scannen lassen.

MfG, Jörn