ErikP hat geschrieben:txt-file mit 10 Mio. Zeilen
Bist du sicher, dass du das mit
Calc erledigen willst? Mein LibreOffice-
Calc 3.5.4.2 kann jedenfalls nur rund 1 Mio. Zeilen (genau 1 048 576) verarbeiten…
Wenn ich das große Datenvolumen außer Acht lasse, wäre die Aufgabe in zwei Suchen&Ersetzen-Durchläufen mit Regulären Ausdrücken zu erledigen:
Spalte mit Flugnummern markieren, Menüpunkt
Bearbeiten > Suchen & Ersetzen… wählen, im
Suchen & Ersetzen-Dialog eingeben:
- Suchen nach: ^([A-Z]{2})([0-9]{1,3})$
- Ersetzen durch: $1000$2
- [Mehr Optionen]
- [✓] Nur in Selektion (Optional)
- [✓] Regulärer Ausdruck
Dein Beispiel sieht dann so aus:
- – AA0001
– CO00014
– LH000335
Im zweiten Durchlauf werden überzählige Nullen entfernt, die im ersten Durchlauf 'reingekommen sind, weil in der ersten Runde mit konstant drei Nullen aufgefüllt wurde. Dazu erneut Spalte mit Flugnummern markieren und im noch geöffneten
Suchen & Ersetzen-Dialog eingeben:
- Suchen nach: ^([A-Z]{2})0*([0-9]{4})$
- Ersetzen durch: $1$2
- [Mehr Optionen]
- [✓] Nur in Selektion (Optional)
- [✓] Regulärer Ausdruck
Damit ist das Ziel erreicht:
- – AA0001
– CO0014
– LH0335
Ich bezweifle allerdings, dass
Calc das richtige Verfahren für diese Datenmenge ist. Ich glaube auch nicht, dass man mit dem
Writer, der ebenfalls mit den Regulären Ausdrücken umgehen kann, glücklicher wird. Vielleicht wird ein Texteditor, der Reguläre Ausdrücken beherrscht, mit der Aufgabe fertig. Das richtige „Werkzeug“ für derartige Datenmengen dürfte aber eine Datenbank sein.
Da wäre dann drüber nachzudenken, wenn du dich entschieden hast, wie du fortfahren willst.
Gruß
lorbass
[quote="ErikP"]txt-file mit 10 Mio. Zeilen[/quote]
Bist du sicher, dass du das mit [i]Calc[/i] erledigen willst? Mein LibreOffice-[i]Calc[/i] 3.5.4.2 kann jedenfalls nur rund 1 Mio. Zeilen (genau 1 048 576) verarbeiten…
Wenn ich das große Datenvolumen außer Acht lasse, wäre die Aufgabe in zwei Suchen&Ersetzen-Durchläufen mit Regulären Ausdrücken zu erledigen:
Spalte mit Flugnummern markieren, Menüpunkt [i]Bearbeiten > Suchen & Ersetzen…[/i] wählen, im [i]Suchen & Ersetzen[/i]-Dialog eingeben:
[list][*] [i]Suchen nach[/i]: [color=#FF0000][b]^([A-Z]{2})([0-9]{1,3})$[/b][/color]
[*] [i]Ersetzen durch[/i]: [color=#FF0000][b]$1000$2[/b][/color]
[*] [[i]Mehr Optionen[/i]]
[*] [[color=#FF0000][b]✓[/b][/color]] [i]Nur in Selektion[/i] (Optional)
[*] [[color=#FF0000][b]✓[/b][/color]] [i]Regulärer Ausdruck[/i][/list]
Dein Beispiel sieht dann so aus:
[list]– AA0001
– CO00014
– LH000335[/list]
Im zweiten Durchlauf werden überzählige Nullen entfernt, die im ersten Durchlauf 'reingekommen sind, weil in der ersten Runde mit konstant drei Nullen aufgefüllt wurde. Dazu erneut Spalte mit Flugnummern markieren und im noch geöffneten [i]Suchen & Ersetzen[/i]-Dialog eingeben:
[list][*] [i]Suchen nach[/i]: [color=#FF0000][b]^([A-Z]{2})0*([0-9]{4})$[/b][/color]
[*] [i]Ersetzen durch[/i]: [color=#FF0000][b]$1$2[/b][/color]
[*] [[i]Mehr Optionen[/i]]
[*] [[color=#FF0000][b]✓[/b][/color]] [i]Nur in Selektion[/i] (Optional)
[*] [[color=#FF0000][b]✓[/b][/color]] [i]Regulärer Ausdruck[/i][/list]
Damit ist das Ziel erreicht:
[list]– AA0001
– CO0014
– LH0335[/list]
Ich bezweifle allerdings, dass [i]Calc[/i] das richtige Verfahren für diese Datenmenge ist. Ich glaube auch nicht, dass man mit dem [i]Writer[/i], der ebenfalls mit den Regulären Ausdrücken umgehen kann, glücklicher wird. Vielleicht wird ein Texteditor, der Reguläre Ausdrücken beherrscht, mit der Aufgabe fertig. Das richtige „Werkzeug“ für derartige Datenmengen dürfte aber eine Datenbank sein.
Da wäre dann drüber nachzudenken, wenn du dich entschieden hast, wie du fortfahren willst.
Gruß
lorbass