Seite 1 von 1
Absätze nach PDF Import - makro zum entfernen?
Verfasst: Do, 21.10.2010 15:34
von desputin
Hallo Ihr,
ich habe ein altes und sicherlich sehr gutes Problem, welches ich jetzt endlich angehen möchte:
Wenn ich passagen aus PDF Dokumenten per copy & Paste in Openoffice/LibreOffice einfüge, dann sind ja bekanntermaßen dort die harten Absätze drin, die nicht reingehören.
Hat jemand von Euch eventuell schon mal ein Makro geschrieben, mit welchem man diese Absätze intelligent entfernen kann (also so, daß "echte" Absätze nicht verloren gehen und auch nichts vom Text gelöscht wird) ?
Viele Grüße Christopher
Re: Absätze nach PDF Import - makro zum entfernen?
Verfasst: Do, 21.10.2010 16:37
von Karolus
Hallo
Wenn die "echten Absatzumbrüche" jetzt bei dir aus "leeren Absätzen" besteht ( also 2 Umbrüchen hintereinander ) - dann versuchs mal mit → Suchen und ersetzen:
1.Durchgang (suche nach leeren Absätzen und ersetze durch eine Zeichenfolge die sonst nirgends im Dokument auftaucht )
- → suche ^$ ersetze durch @@@@ mit der Option [x]regulärer Ausdruck
2. Durchgang (ersetze alle noch vorhandenen Umbrüche durch nichts. )
- → suche $ ersetze durch nichts. ebenfalls mit der Option [x]regulärer Ausdruck
3. Durchgang (wandle die Ersetzungzeichenfolge aus 1. zurück in Umbrüche. )
- → suche @@@@ ersetze durch \n wieder mit [x]regulärer Ausdruck
Gruß Karo
Re: Absätze nach PDF Import - makro zum entfernen?
Verfasst: Fr, 22.10.2010 16:01
von DPunch
Aloha
christopherstark hat geschrieben:Wenn ich passagen aus PDF Dokumenten per copy & Paste in Openoffice/LibreOffice einfüge, dann sind ja bekanntermaßen dort die harten Absätze drin, die nicht reingehören.
Bedauerlicherweise werden die Umbrüche aus der PDF-Datei schon beim Einfügen in die Zwischenablage (Strg+C) allesamt zu CRLFs umgewandelt, egal aus welchem Grund der Umbruch in der PDF-Datei zustande kommt, so dass eine "intelligente" Nachbearbeitung meines Wissens nach schlicht nicht möglich ist - woher soll man (respektive ein Makro) denn auch wissen, welche Umbrüche gewünscht sind und welche nicht.
Insofern bliebe da wohl nur ein Behelfs-Makro, dass z.B. aus einem markierten Bereich alle Umbrüche entfernt und diesen somit zu einem einzigen, gewollten Absatz zusammenfasst (möglicherweise gibt es sowas sowieso schon als Standard-Funtion im Writer, keine Ahnung), aber zum kompletten Automatisieren dieses Vorgangs wüsste ich jetzt noch nichtmal einen Punkt zum Ansetzen.