Aus pdf Tabelle Daten kopieren

Das Tabellenkalkulationsprogramm

Moderator: Moderatoren

open1948
****
Beiträge: 161
Registriert: Mi, 14.09.2005 14:12

Aus pdf Tabelle Daten kopieren

Beitrag von open1948 »

Ich muss oft aus pdf Tabellen Daten zur Weiterberechnung nach Calc bringen.
Der einfachste Weg ist aus dem Adobe 7 per Copy-> Paste in Calc.
Dabei kommt die ganze Zeile in die erste Calc Zelle.
Wenn ich Glück habe, und die pdf Tabelle keine Tausender-Leerstellen hat, dann kann ich mit Word aus den Leerstellen, die dem Trennzeichen zur nächsten Zelle entsprechen , dann einen Tabulator machen. In der Hoffnung, dass beim erneuten Copy aus Word -> Paste in Calc dieser Tabulatur zur richtigen Einordnung in die richtige Zelle führt.

Gibt es pdf Viewer, die es gestallten nur einen Zellenbereich herauszuschneiden ohne dass die ganzen Zeilen mitgeschleppt werden müssen.
Gerne auch auf Linux
Gibt es Editoren, die das Spiel mit der Umwandlung von Leerstellen -> Tabulatoren können? Ggf mit regulären Ausdrücken.
Oder gibt es spezialisierte tools?
Danke vorab.
Karolus
********
Beiträge: 7533
Registriert: Mo, 02.01.2006 19:48

Beitrag von Karolus »

Hallo

Ob es einen pdf-viewer mit der gewünschten Funktionalität gibt, kann ich dir nicht beantworten. - aber ich kann dir "Text to Columns" empfehlen. Das Makro erspart dir zumindest den Umweg über Writer. Zu finden ist es hier :
http://ooomacros.sourceforge.net/user.php#104183

Schau es dir mal an.

Gruß Karo
open1948
****
Beiträge: 161
Registriert: Mi, 14.09.2005 14:12

Beitrag von open1948 »

Vielen Dank für den Tip.
Ich hatte schon mal ein Makro installiert - extendedPDF.
Diese Anleitung ist zwar nicht das Thema, aber zeigt gut Step für Step auf.
http://calc2latex.sourceforge.net/install_oo20/

Nach Restart von ooCalc sehe ich unter Extras > Addons nur das bereits installierte extendedPDF, das text2columns fehlt.

Oder muss ich sonst was machen?

Diese Anleitung fand ich auch noch hilfreich:
http://www.xaprb.com/blog/2006/06/26/ho ... eorg-calc/
Karolus
********
Beiträge: 7533
Registriert: Mo, 02.01.2006 19:48

Beitrag von Karolus »

Hallo

Text2Columns wird über ->Extras->Package Manager installiert.-
also zunächst:
-Text2Columns.zip herunterladen und auf der Festplatte speichern (nicht entpacken)
- Package Manager aufrufen (siehe oben)
- 'Meine Packages' selektieren, und auf 'Hinzufügen' klicken.
- Im erscheinenden Datei-dialog den Pfad zum Text2Columns.zip - Archiv einstellen und 'ok'.

Jetzt steht Text2Columns unter ->Extras->Addons zur Verfügung, kann aber auch ebensogut einem Tastaturkürzel zugeordnet werden.

Gruß Karo
open1948
****
Beiträge: 161
Registriert: Mi, 14.09.2005 14:12

Beitrag von open1948 »

Das war der richtige Weg, über "Package Manager" und nicht über Makro.

Das tool wird grossartig funktionieren, wenn als Tausenderzeichen ein Punkt "." benutzt wird.
In meinem Fall ist nach "Copy aus dem pdf/Paste in Calc," das Tausenderzeichen ein Space " "; und ebenfalls ein Space ist von der Spaltentrennung übergeblieben.
Also werden aus 2 pdf Spalten nun 4 Calc Spalten.
Spalte_1 Spalte_2
123 456 987 654
123|456|987|654

1. Führende Nullen beibehalten:
Bei 123 056 fällt die führende Null in der zweiten Spalte weg:
123|56
Auch wenn ich beim "Zellen Formatieren" die Checkbox "Führende Nullen" angekreuzt habe.
2. Zwei Spalten verbinden
Ich kann zwei Spalten vereinigen durch
= A1&B1 in eine neue Spalte
und den Ausdruck dann die ganze Spalte runterziehen.
Gibt es dafür mittels Anmarkieren von 2 Spalten einen Befehl:
"Vereinige zwei Spalten"?
so dass aus
123|456
die Zahl 123456 wird.
Das Zellen verbinden geht nur zwischen 2 Zellen, aber nicht zwischen zwei Spalten.

Die weitere Formatierung mit den Tausenderzeichen wäre dann einfach.
Danke vorab
open1948
****
Beiträge: 161
Registriert: Mi, 14.09.2005 14:12

Regex Lösung mit Edit Pad Pro

Beitrag von open1948 »

Ich habe die obige Weiterbearbeitung eines Textes gemacht mit Edit Pad Pro.
Die Funktion mit den Regulären Ausdrücken gab/gibt? es auch kostenlos.
Der erste Ausdruck beschreibt den Suchausdruck, das zweite " " ist das Ersetzungsmuster.

([0-9]{1,3}) ([0-9]{1,3}) "\1\2" löscht das störende TausenderLeerzeichen

[+-] [0-9]{1,6} "\1\2" löscht das Leerzeichen zwischen Zahl und Vorzeichen

[ ]{1,19} " " reduziert lange Ketten mit Leerzeichen auf eins

Den Rest kann "Text to Columns" perfekt in eine Calc Tabell umwandeln.
Da ich von Windows auf Linux wechseln möchte würde mich interessieren welches Linuxtool ebenfalls mit Regex ersetzen kann.
Antworten