Seite 1 von 2

Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Di, 14.04.2015 18:59
von swinit
So, Hallo erstmal, bin neu in diesem Forum und hab auch gleich mal ein Anliegen mit dessen Lösung ich leider überfordert. Und zwar geht es darum:

Ich habe vom Chef eine PDF-Datei bekommen, mit 99 Seiten, die aus Kontoauszügen quasi bestehen. Diese Datei soll in eine txt. oder csv. datei konvertiert werden oder ebendrum in eine xls.datei, um diese bearbeiten zu können, um dann zum Schluss die fertige txt. oder csv.datei in lexware (ein buchungsprogramm) zu importieren. Lexware das Programm selbst, besteht allerdings darauf, dass die Datei entweder datev ist oder eben txt. und zudem möchte Lexware ganz gerne, dass jeder Kontoumsatz von den zich Seiten eine Zeile nur hat, was ich ganz gern bei Office Calc einstellen wollte. Und genau da komm ich nicht weiter. Ich hab schon alles probiert und ein guter Bekannte sagte nun, man müsse es in Calc programmieren wenn dann, evtl. mit Pythos. Hab aber kaum Ahnung von sowas.....Also hab auch viel bereits mit der Importmöglichkeit bei Calc selbst probiert, wie mit Semikolon, Tabulator, Leerzeichen etc......Mein Bekannter hat es zumindest soweit geschafft, dass jetzt jede Buchung bzw. jeder Buchungssatz in 2 Zeilen jeweils steht, was aber leider noch immer nicht korrekt ist, um das ganze in Lexware zu importieren.

Kann mir vielleicht jemand hier dabei helfen, ob über Teamviewer oder am besten es erklären für Leute, wie mich, die da nicht sooooo den mega Durchblick haben.....Ich versuch mir das alles grad auch selbst irgendwie anzueignen, aber ja ist nicht so ganz einfach, wie ich dachte.

Glg :)

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Di, 14.04.2015 21:13
von F3K Total
Hallo erstmal.
Was hat dein Chef genommen?
Üblicherweise kann man Kontodaten direkt als .csv herunterladen.
.pdf ist denkbar ungeeignet, verkompliziert die Sache und macht sie fehleranfällig.
Bitte ihn doch mal zu schauen, ob er da, wo er die Daten her hat, nich direkt .csv bekommen kann, bei mir sieht das z.B. so aus:
csv.png
csv.png (6.42 KiB) 4152 mal betrachtet
Gruß R

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Di, 14.04.2015 21:31
von swinit
Hey hey, aufjedenfall schon mal danke für die Antwort. Die Daten sind von seiner Bank als PDF, dort hat er bereits angerufen und nachgefragt, ob er es als txt. oder csv. bekommt, aber die meinten, dass sie das rückwirkend nicht machen, bzw. nicht gehen würde, deshalb diese leider blöde situation :/

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Di, 14.04.2015 22:53
von swinit
nochmal kurze erklärung, was genau mein chef möchte :

Ich will aus jeder Buchung die drei wichtigen Faktoren herausfiltern, die ich für die Eingabe in Lexware brauche:
(valuta)datum, Betrag und buchungstext.
Soll
Haben
Nummer
Und
Steuer
Müsste ich eh manuell hinzufügen.


Und so sieht der inhalt einer export-datei aus (ergo, so muss es dann aussehen, ob txt oder (mit feldtrennern statt Semikolons) xls
01.01.2012;30.03.2015;"";"3";"Anfangsbestand Kasse";84,81;1000;9000;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010301";"anfangsbestandCoBa";24,99;1200;9000;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010501";"EB-Wert";11.636,74;9000;1210;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010502";"porto";0,55;4970;1210;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010601";"subvert2669";54,39;8401;1220;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010302";"subvert2667";19,80;1200;8400;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010303";"b+s card";218,25;1200;8409;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010303";"b+s card gebⁿhr";7,79;4970;1200;9;"";"";"EUR"

Also:
Belegdatum;Buchungsdatum;"";"Belegnummer";"Buchungstext";Betrag;Sollkonto;Habenkonto;???(0 oder 9 – keine Ahnung, wofür das steht);"";"";"EUR"

Vieles kann man also auch in die Tonne hauen, von dem, was dadrin steht.

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 07:08
von clag
Hallo swinit,

du solltest vielleicht mal eine Beispieldatei mit etwas Ausgangstext (min. 3 Datensätze)
und eine Beispieldatei wie das gewünschte Ergebnis aussehen soll.

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 08:11
von swinit
problem ist die verschwiegenheitserklärung ;) deshalb wenn jemand sich damit sonst auskennt, könnte man das per pn am besten klären, oder derjenige schaut kurz über teamviewer auf das problem.... :)

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 08:22
von Karolus
Fragt die Bank nochmal nach einem (zusätzlichen) Export in einem vernünftigen Format, wenn die das nicht machen will, druckst du die pdf aus und tippst daraus per Hand die nötigen Informationen ab, ausserdem sollte dein Chef in dem Fall die Bank wechseln.

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 08:24
von clag
Hallo swinit,

"Evelyn Tucker" in "Daisy Duck"
und
"Hans Rosenhügel" in "Bugs Bunny"
zu ändern sollte doch nicht so schwer sein :-P


PS
oder auch Karolus Vorschlag umsetzen

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 08:59
von swinit
also die bank hat er sowieso glaub ich gewechselt, das sind halt auszüge aus vergangenen jahren, die unbedingt gebucht werden müssen für finanzamt etc....

problem is einfach, egal wie ich es versuche wenn ich die txt.datei bei excel reinhauen will über tabelle aus datei einfügen, kann man ja noch einstellungen vornehmen, wie z.b. felder trennen, semikolon etc.....sieht auch alles nett aus, aber es geht halt nicht, dass eine buchung nur eine zeile beträgt, das müsste man dann doch scheinbar per hand machen, naja ziemlich aufwendig, das lass ich dann auch :D .....ich weiss halt nur von nem kollegen, dass man wenn man z.b python beherrscht, es auch in wenigen schritten programmieren kann.....allerdings müsst ich mich in python erstma reinlesen.....dachte halt hier hätte sonst jemand in der richtung mehr ahnung oder könnte helfen

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:03
von swinit
im prinzip soll es so aussehen :

01.01.2012;30.03.2015;"";"3";"Anfangsbestand Kasse";84,81;1000;9000;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010301";"anfangsbestand CoBa";24,99;1200;9000;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010501";"EB-Wert";11.636,74;9000;1210;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010502";"porto";0,55;4970;1210;0;"";"";"EUR"
01.01.2012;30.03.2015;"";"12010601";"subvert2669";54,39;8401;1220;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010302";"subvert2667";19,80;1200;8400;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010303";"b+s card";218,25;1200;8409;0;"";"";"EUR"
02.01.2012;30.03.2015;"";"12010303";"b+s card gebühr";7,79;4970;1200;9;"";"";"EUR"

im editor später als csv, um es dann gescheit in lexware reinzuhauen, aaaaber bisher hab ichs nur auf 2 zeilen geschafft, wo leider auch einige teile verschoben worden , dass sah dann so aus :

02.01.2013 04.01.13 996600 001 Einr.Last + 599,14BSCARD SUBVERT.DE Ref.-Nr. 5505548001
Überw./Zahl.-Empf.: BSCARD SUBVERT.DE
02.01.2013 02.01.13 993000 001 SBÜberw. -600,00BLZ:20190003 KTO: 12227501 KD 0020355263 TAN 879333 Datum: 01.01.13 Zeit: 14:29 Privatentnahme
Überw./Zahl.-Empf.: Lux, VolkerBegünst./Zahl.-Pfl.: Volker Lux
02.01.2013 02.01.13 991304 001 DAU-Überw -326,00Miete Lux Neuer Pferdemarkt 32 Souterrain Dauerauftrag: 1
Überw./Zahl.-Empf.: Lux, VolkerBegünst./Zahl.-Pfl.: Abteigrund GmbH & Co KG
02.01.2013 02.01.13 997122 001 Gutschr. + 25,79NR0425670 ECMCRE9511018994 26,74 -SERV 0,80+19% MWST 0,15VU 0425670 REF
Überw./Zahl.-Empf.: B+S CARD SERVICE GMBH Begünst./Zahl.-Pfl.: SUBVERT 02.01.2013 02.01.13 997122 001 Gutschr. + 66,29Überw./Zahl.-Empf.: ANDREAS FISCHER BEI DAUSACK Begünst./Zahl.-Pfl.: SUBVERT STORE 02.01.2013 02.01.13 997122 001 Gutschr. + 109,80Überw./Zahl.-Empf.: FISCHER ANDREAS Begünst./Zahl.-Pfl.: SUBUERT STORE
03.01.2013 03.01.13 997108 001 Gutschr. + 65,63SUBVERT-3294-STORE V-SKATES CHRISTOPH WINTER
Überw./Zahl.-Empf.: CHRISTOPH WINTER Begünst./Zahl.-Pfl.: SUBVERT 03.01.2013 03.01.13 997108 001 Gutschr. + 49,90SUBVERT-3288-STORE Überw./Zahl.-Empf.: STEFANIE HIRT Begünst./Zahl.-Pfl.: SUBVERT 03.01.2013 03.01.13 997110 001 Gutschr. + 45,85SUBVERT-3290-STORE Überw./Zahl.-Empf.: HEIKO SAUER Begünst./Zahl.-Pfl.: SUBVERT
03.01.2013 03.01.13 997110 001 Gutschr. + 32,08SUBVERT-3293-STORE V-SKATES FLORIAN SCHUG
Überw./Zahl.-Empf.: FLORIAN SCHUG Begünst./Zahl.-Pfl.: SUBVERT

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:07
von swinit
anbei nochmal ein screenshot, von excel und kommentaren meines chefs :D

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:16
von Stephan
von mir mal folgende Anmerkungen:

was Karolus zum "vernünftigen Format" sagt ist völlig richtig, der Punkt ist einfach das PDF, an dieser Stelle, die Weiterverarbeitung gravierend erschwert.

Die Frage der Beispieldatei ist (verständlicherweise) wohl auch ein Problem wenn nur das fertige PDF existiert
(denn das ist nicht so einfach zu anonymisieren bzw. es geht ja hier nicht nur um die Datenstruktur sondern evtl. auch um andere Spezifika im PDF die bei einer Nachbearbeitung sich ändern könnten wodurch die Datei dann eigentlich nur noch eingeschränkt als Beispiel taugt)


Das PDF-Format ist, wie schon angedeutet, zu diesem Zweck extrem ungünstig, sollte es sich nur darum handeln eine solche PDF-Datei einmalig konvertieren/einlesen zu müssen könnte man versuchen es auf dem Umweg OCR oder auch eines externen PDF-Konverters zu machen, also erst damit zu txt oder csv wandeln und dann in Calc importieren und bei der Konvertierung möglicherweise entstehende Fehler händisch korrigieren - wobei ich nicht weiß ob das in Summe schneller geht als dass von Karolus vorgeschlagene Abtippen, denn es ist erfahrungsgemäß sehr schwer vereinzelte Fehler beim Durchlesen solcher Datenreihen zu finden.
(ohne ein konkretes Dokument gesehen zu haben ist vorstehende Empfehlung nur etwas was aus Erfahrung und Bauchgefühl resultiert, ich habe keine konkrete Begründung für gerade diesen Weg)

Sollen hingegen dauerhaft immer wieder solche PDF verarbeitet werden müsste man sich das Ganze sehr genau ansehen und sorgfältig die Umsetzung überlegen, denn die Schwierigkeit liegt insbesondere auch darin das bei der Konvertierung einzelne Zeichen/Zahlen verstümmelt/verändert werden und man das im Routinebetrieb zuverlässig ausschließen muss.
Ich würde deshalb Hilfe bei einem Dienstleister suchen, z.B. eine Übersicht zu entsprechenden Dienstleister für OO ist hier:
http://www.openoffice.org/bizdev/consultants.html


Gruß
Stephan

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:24
von swinit
Puh aufjedenfall danke für die Antwort :)

Hab die ganze Pdf , wie ich meine bereits geschrieben zu haben, mit nem converter in txt. umgewandelt, leider konnt ich nix finden, dass ich sie direkt von pdf zu csv umwandle, naja und dann halt in calc reingehauen, was ja leider nich viel brachte.....egal, ich versuchs irgendwie weiter, ansonsten muss mein chef wohl oder übel selbst vorgehen und eintippen :D ;) trotzdem danke für die hilfe

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:38
von Stephan
im prinzip soll es so aussehen :

...

aaaaber bisher hab ichs nur auf 2 zeilen geschafft, wo leider auch einige teile verschoben worden , dass sah dann so aus :
Auf den ersten Blick ist zu sehen das der erstere Textauszug das Wort "Anfangsbestand" enthält, der zweite Textauszug nicht, mithin die Beiden nichts Direktes miteinander zu tun haben und ich deshalb beim besten Willen nicht weiß was wir davon ableiten sollen.


Gruß
Stephan

Re: Aus Buchungsdaten von einer Txt.Datei eine Zeile machen...

Verfasst: Mi, 15.04.2015 09:42
von swinit
hey, ja der erste auszug ist nur ein test-export gewesen, woran man ableiten kann, wie es später aussehen soll, die beiden sind vom text her nicht identisch bzw. von den buchungen.....

problem is einfach, ich kann die pdf nicht als csv direkt umwandeln, sonst wäre alles einfacher, da bleibt mir dann meist nur txt. oder xls.....so tue ich dies, verschiebt sich leider viel, was ja klar is, weshalb ich dann calc brauche, und den txt. imporiere, wo ich dann beim import-assistentin lande, und dort ja schaff ich es auch nicht, eine buchung in eine zeile zu kriegen.....man es etwas begradigen, aber im prinzip muss man den rest trotzdem in calc selbst eintippen verschieebn etc.....

ich dachte halt, ob man so den zwischenschritt programmieren könnte, was mein kollege vorschlug....naja egal