Absätze nach PDF Import - makro zum entfernen?

Programmierung unter AOO/LO (StarBasic, Python, Java, ...)

Moderator: Moderatoren

desputin
***
Beiträge: 73
Registriert: Fr, 08.08.2008 12:35

Absätze nach PDF Import - makro zum entfernen?

Beitrag von desputin »

Hallo Ihr,

ich habe ein altes und sicherlich sehr gutes Problem, welches ich jetzt endlich angehen möchte:

Wenn ich passagen aus PDF Dokumenten per copy & Paste in Openoffice/LibreOffice einfüge, dann sind ja bekanntermaßen dort die harten Absätze drin, die nicht reingehören.
Hat jemand von Euch eventuell schon mal ein Makro geschrieben, mit welchem man diese Absätze intelligent entfernen kann (also so, daß "echte" Absätze nicht verloren gehen und auch nichts vom Text gelöscht wird) ?

Viele Grüße Christopher
Karolus
********
Beiträge: 7532
Registriert: Mo, 02.01.2006 19:48

Re: Absätze nach PDF Import - makro zum entfernen?

Beitrag von Karolus »

Hallo
Wenn die "echten Absatzumbrüche" jetzt bei dir aus "leeren Absätzen" besteht ( also 2 Umbrüchen hintereinander ) - dann versuchs mal mit → Suchen und ersetzen:
1.Durchgang (suche nach leeren Absätzen und ersetze durch eine Zeichenfolge die sonst nirgends im Dokument auftaucht )
  • → suche ^$ ersetze durch @@@@ mit der Option [x]regulärer Ausdruck
2. Durchgang (ersetze alle noch vorhandenen Umbrüche durch nichts. )
  • → suche $ ersetze durch nichts. ebenfalls mit der Option [x]regulärer Ausdruck
3. Durchgang (wandle die Ersetzungzeichenfolge aus 1. zurück in Umbrüche. )
  • → suche @@@@ ersetze durch \n wieder mit [x]regulärer Ausdruck
Gruß Karo
LO7.4.7.2 debian 12(bookworm) auf Raspberry5 8GB (ARM64)
LO25.2.3.2 flatpak debian 12(bookworm) auf Raspberry5 8GB (ARM64)
DPunch
*******
Beiträge: 1112
Registriert: Mo, 02.11.2009 16:16
Wohnort: Marburg

Re: Absätze nach PDF Import - makro zum entfernen?

Beitrag von DPunch »

Aloha
christopherstark hat geschrieben:Wenn ich passagen aus PDF Dokumenten per copy & Paste in Openoffice/LibreOffice einfüge, dann sind ja bekanntermaßen dort die harten Absätze drin, die nicht reingehören.
Bedauerlicherweise werden die Umbrüche aus der PDF-Datei schon beim Einfügen in die Zwischenablage (Strg+C) allesamt zu CRLFs umgewandelt, egal aus welchem Grund der Umbruch in der PDF-Datei zustande kommt, so dass eine "intelligente" Nachbearbeitung meines Wissens nach schlicht nicht möglich ist - woher soll man (respektive ein Makro) denn auch wissen, welche Umbrüche gewünscht sind und welche nicht.

Insofern bliebe da wohl nur ein Behelfs-Makro, dass z.B. aus einem markierten Bereich alle Umbrüche entfernt und diesen somit zu einem einzigen, gewollten Absatz zusammenfasst (möglicherweise gibt es sowas sowieso schon als Standard-Funtion im Writer, keine Ahnung), aber zum kompletten Automatisieren dieses Vorgangs wüsste ich jetzt noch nichtmal einen Punkt zum Ansetzen.
Antworten