Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Das Tabellenkalkulationsprogramm

Moderator: Moderatoren

Karolus
********
Beiträge: 7532
Registriert: Mo, 02.01.2006 19:48

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von Karolus »

Hallo

.csv ist purer Text, du musst lediglich den Dateinamen ändern von blah.txt auf blah.csv
LO7.4.7.2 debian 12(bookworm) auf Raspberry5 8GB (ARM64)
LO25.2.3.2 flatpak debian 12(bookworm) auf Raspberry5 8GB (ARM64)
nikki
******
Beiträge: 787
Registriert: Do, 05.03.2015 10:42

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von nikki »

Hallo,
ob .txt- oder .csv-Datei ist einerlei. Beides sind Textdateien die sich nur in der Dateiendung unterscheiden. Stattdessen kommt es auf den Inhalt an.

Wenn Du z.B. eine .txt-Datei mit dem korrekten Inhalt hast, brauchst Du nur die Dateiendung .txt durch .csv zu ersetzen.
Gruß

---------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von Stephan »

und dort ja schaff ich es auch nicht, eine buchung in eine zeile zu kriegen
mit dem Assistenten nicht, aber dass geht doch per Formel,z.B.:

kopiere den Text (siehe zweites Textbeispiel in DEinem post vom 15.04.15 9:03 ) in "Tabelle1" in die Spalte A
schreibe in "Tabelle2" in Zelle A1 die Formel: =WENN(LINKS(Tabelle2.A2;12)="Überw./Zahl.";Tabelle2.A1&Tabelle2.A2;"")

ziehe diese Formel beliebig weit nach unten

jede zweite Zeile ist nun leer, deswegen sortiere z.B. aufsteigend und alle Zeilen mit Inhalt stehen untereinander und jede Zeile enthält nun einen Buchungssatz


Ich sehe allerdings nicht das das das Problem schon nennenwert löst, denn die Buchungssätze enthalten keine Trenner anhand derer man die einzelnen FElder leicht aufteilen könnte.


Gruß
Stephan
swinit
*
Beiträge: 11
Registriert: Di, 14.04.2015 18:50

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von swinit »

hey super, die antwort war aufjedenfall so dass ich echt voran gekommen bin, an sich hat es soweit geklappt, allerdings nervt lexware jetz nur noch.....aber es sieht bisher sehr gut aus, alles in einer zeile mit feldtrennern klappts dann auch....danke aufjedenfall
swinit
*
Beiträge: 11
Registriert: Di, 14.04.2015 18:50

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von swinit »

das euro zeichen ist nur irgendwie weg, also wird nicht mitgenommen? wie ergänze ich da die formel?
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von Stephan »

mit feldtrennern klappts dann auch
Wie denn?

Ich hatte doch bereits geschrieben das ich dafür nun gerade keine (einfache) Lösung sehe, so wie die Daten vorliegen.
wie ergänze ich da die formel?
Garnicht, denn die Formel 'verschluckt' keine Eurozeichen, sondern kopiert/kombiniert stur den vorhandenen Text. Wenn Eurozeichen fehlen dann weil sie schon im Ausgangstext fehlen (also dem Text der in "Tabelle1" kopiert wurde).

Der Beispieltext von Dir enthält z.B. keine Eurozeichen und darüber hinaus entzieht es sich meiner Kenntnis warum das so ist, denn wenn dieser Text zunächst aus einem PDF durch Umwandlung erzeugt wurde hatte ich ja bereits genau auf solche Probleme hingewiesen:

"die Schwierigkeit liegt insbesondere auch darin das bei der Konvertierung einzelne Zeichen/Zahlen verstümmelt/verändert werden [können]"



Gruß
Stephan
Hiker
******
Beiträge: 593
Registriert: Mo, 08.09.2014 21:34
Wohnort: Berlin

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Beitrag von Hiker »

Hallo,
swinit hat geschrieben:problem is einfach, ich kann die pdf nicht als csv direkt umwandeln, sonst wäre alles einfacher,
.....
ich dachte halt, ob man so den zwischenschritt programmieren könnte, was mein kollege vorschlug....naja egal
der pdf2txt.Konverter bringt dir halt nur die Buchstaben wieder in eine lesbare Reihenfolge, dekodiert nebenbei komprimierte Segmente und wirft
alles weg, was nur Anweisungen für das Layout sind (Schriftarten....).
Wenn Du Lust hast, öffne mal Deine PDF-Datei mit einem Texteditor und such dann (per Suchfunktion) nach einem der ersten
Buchungstexte. Wenn Du Ihn findest, hast Du eine Vorstellung, was die Ausgangsbasis ist.

Wenn Du den Text nicht findest (wie Ich bei meiner Tabelle über E10-Verträglichkeit bei Automarken) müsstest Du via

Code: Alles auswählen

pdftk Kontoauszug.pdf output plain.txt uncompress
den Text erstmal dekomprimieren (hab ich kurz ergoogelt siehe:
http://www.heise.de/security/artikel/Ta ... kelseite=2 )

Eine sinnvolle Konvertierung nach csv müsste die Struktur in der pdf-Datei erkennen, etwas was nicht ganz trivial ist und auch in Python mehr als ein paar Zeilen braucht - denn ein einfaches Regelwerk kann ich in Deinen Beispielen nicht erkennen.
Einige OCR-Programme bringen inzwischen recht ordentliche Tabellenerkennungen mit - evtl versuchst Du es mal mit eine Testversion von Finereader oder Omnipage - wenn es denn eine gibt. Lohnen tut sich der Aufwand aber meist erst, wenn man das mehr als einmal braucht. Immerhin kann man Dort meist einmal die Tabelle auf der ersten Seite einrichten und dann die Folgeseiten in dieselbe Tabelle scannen lassen.

MfG, Jörn
Libre Office 6.3.1 (Win 10 Pro) / Libre Office 6.0.7 (Win8.1 Pro, Win 7 Pro) / AOO (Win 7)
Antworten