Aus pdf Tabelle Daten kopieren

Antwort erstellen


BBCode ist eingeschaltet
[img] ist ausgeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Aus pdf Tabelle Daten kopieren

Regex Lösung mit Edit Pad Pro

von open1948 » Do, 14.09.2006 09:33

Ich habe die obige Weiterbearbeitung eines Textes gemacht mit Edit Pad Pro.
Die Funktion mit den Regulären Ausdrücken gab/gibt? es auch kostenlos.
Der erste Ausdruck beschreibt den Suchausdruck, das zweite " " ist das Ersetzungsmuster.

([0-9]{1,3}) ([0-9]{1,3}) "\1\2" löscht das störende TausenderLeerzeichen

[+-] [0-9]{1,6} "\1\2" löscht das Leerzeichen zwischen Zahl und Vorzeichen

[ ]{1,19} " " reduziert lange Ketten mit Leerzeichen auf eins

Den Rest kann "Text to Columns" perfekt in eine Calc Tabell umwandeln.
Da ich von Windows auf Linux wechseln möchte würde mich interessieren welches Linuxtool ebenfalls mit Regex ersetzen kann.

von open1948 » Mi, 13.09.2006 16:23

Das war der richtige Weg, über "Package Manager" und nicht über Makro.

Das tool wird grossartig funktionieren, wenn als Tausenderzeichen ein Punkt "." benutzt wird.
In meinem Fall ist nach "Copy aus dem pdf/Paste in Calc," das Tausenderzeichen ein Space " "; und ebenfalls ein Space ist von der Spaltentrennung übergeblieben.
Also werden aus 2 pdf Spalten nun 4 Calc Spalten.
Spalte_1 Spalte_2
123 456 987 654
123|456|987|654

1. Führende Nullen beibehalten:
Bei 123 056 fällt die führende Null in der zweiten Spalte weg:
123|56
Auch wenn ich beim "Zellen Formatieren" die Checkbox "Führende Nullen" angekreuzt habe.
2. Zwei Spalten verbinden
Ich kann zwei Spalten vereinigen durch
= A1&B1 in eine neue Spalte
und den Ausdruck dann die ganze Spalte runterziehen.
Gibt es dafür mittels Anmarkieren von 2 Spalten einen Befehl:
"Vereinige zwei Spalten"?
so dass aus
123|456
die Zahl 123456 wird.
Das Zellen verbinden geht nur zwischen 2 Zellen, aber nicht zwischen zwei Spalten.

Die weitere Formatierung mit den Tausenderzeichen wäre dann einfach.
Danke vorab

von Karolus » Di, 12.09.2006 20:56

Hallo

Text2Columns wird über ->Extras->Package Manager installiert.-
also zunächst:
-Text2Columns.zip herunterladen und auf der Festplatte speichern (nicht entpacken)
- Package Manager aufrufen (siehe oben)
- 'Meine Packages' selektieren, und auf 'Hinzufügen' klicken.
- Im erscheinenden Datei-dialog den Pfad zum Text2Columns.zip - Archiv einstellen und 'ok'.

Jetzt steht Text2Columns unter ->Extras->Addons zur Verfügung, kann aber auch ebensogut einem Tastaturkürzel zugeordnet werden.

Gruß Karo

von open1948 » Di, 12.09.2006 11:29

Vielen Dank für den Tip.
Ich hatte schon mal ein Makro installiert - extendedPDF.
Diese Anleitung ist zwar nicht das Thema, aber zeigt gut Step für Step auf.
http://calc2latex.sourceforge.net/install_oo20/

Nach Restart von ooCalc sehe ich unter Extras > Addons nur das bereits installierte extendedPDF, das text2columns fehlt.

Oder muss ich sonst was machen?

Diese Anleitung fand ich auch noch hilfreich:
http://www.xaprb.com/blog/2006/06/26/ho ... eorg-calc/

von Karolus » Mo, 11.09.2006 17:44

Hallo

Ob es einen pdf-viewer mit der gewünschten Funktionalität gibt, kann ich dir nicht beantworten. - aber ich kann dir "Text to Columns" empfehlen. Das Makro erspart dir zumindest den Umweg über Writer. Zu finden ist es hier :
http://ooomacros.sourceforge.net/user.php#104183

Schau es dir mal an.

Gruß Karo

Aus pdf Tabelle Daten kopieren

von open1948 » Mo, 11.09.2006 17:12

Ich muss oft aus pdf Tabellen Daten zur Weiterberechnung nach Calc bringen.
Der einfachste Weg ist aus dem Adobe 7 per Copy-> Paste in Calc.
Dabei kommt die ganze Zeile in die erste Calc Zelle.
Wenn ich Glück habe, und die pdf Tabelle keine Tausender-Leerstellen hat, dann kann ich mit Word aus den Leerstellen, die dem Trennzeichen zur nächsten Zelle entsprechen , dann einen Tabulator machen. In der Hoffnung, dass beim erneuten Copy aus Word -> Paste in Calc dieser Tabulatur zur richtigen Einordnung in die richtige Zelle führt.

Gibt es pdf Viewer, die es gestallten nur einen Zellenbereich herauszuschneiden ohne dass die ganzen Zeilen mitgeschleppt werden müssen.
Gerne auch auf Linux
Gibt es Editoren, die das Spiel mit der Umwandlung von Leerstellen -> Tabulatoren können? Ggf mit regulären Ausdrücken.
Oder gibt es spezialisierte tools?
Danke vorab.

Nach oben