Seite 1 von 1

Re: Pdf zu komplex?

Verfasst: Di, 19.10.2010 18:54
von hylli
Vermutlich weil es als Grafik (PDF) gescannt wurde und keine Texterkennung (OCR) genutzt wurde.

Hylli

Re: Pdf zu komplex?

Verfasst: Mi, 20.10.2010 00:09
von Thomas Mc Kie
Nur weil du mit deinem Drucker eine pdf drucken kannst und mit einem Scanner aus einem gedruckten Papier ein pdf erzeugen kannst sind darin nicht dieselben Daten enthalten, selbst wenn sie gleich aussehen. Was du brauchst, wäre das originale pdf (wenn es eins gibt), ansonsten musst du mit dem gescanten (das besteht nur aus "Fotos" (!) von den eingescanten Seiten, die in einem pdf abgelegt wurden) leben.

Grüße

Thomas

Re: Pdf zu komplex?

Verfasst: Mi, 20.10.2010 01:19
von Constructus
Hallo Jezzi,

Scans, die irgenwie noch weiterbearbeitet werden sollen, als PDF abzuspeichern, ist nicht sehr sinnvoll.

Zwar läßt sich aus solchen PDF Text herauslesen, aber einzeln bearbeiten nicht. Eine Möglichkeit wäre, in einem Grafikprogramm (vielleicht auch schon im OODraw) das PDF in ein anderes Dateiformat zu verwandeln und die zu entfernenden Dinge einfach mit Rahmen abzudecken, die die Umgebungsfarbe haben; ansonsten gilt der Tipp von Thomas.
Es gibt auch die Möglichkeit, einen farbigen Radierer zu beutzen (auf dem Bildschirm...) und so das ungewünschte zu streichen, War eine der Aktionen erfolgreich, kannst Du das Dokument wieder in ein pdf verwandeln.

Leider sind die Tipps ungetestet, da ich pdf nur als Endprodukt betrachte

Viel Erfolg

Constructus

Re: Pdf zu komplex?

Verfasst: Mi, 20.10.2010 19:26
von miesepeter
Gast hat geschrieben:ich verstehe, aber wenn ich es als Text scanne, geht ja dabei die ursprüngliche Formatierung des Dokuments verloren und es wird nur der reine Text gescannt. So will ich das ja auch nicht haben.
Hallo,
da solltest du ein "gescheites" OCR-Programm benutzen, das kann auch Formatierungen aus Scans gewinnen, wenn auch nicht immer so, dass es ohne Nachbearbeitung unmittelbar weiterverarbeitet werden kann. Beispiele für bessere OCR-Programme sind Abbyy oder Caere, die kosten jedoch. Freie Software, die ich je testete, war hier einfach nicht leistungsfähig.

Wenn du solche kommerziellen OCR-Programme öfter oder in der Arbeit benutzt, dann kannst du in absehbarer Zeit sicher die Ausgaben wieder hereinspielen, für gelegentliche Arbeiten sind sie vermutlich zu teuer.

Ciao

Re: Pdf zu komplex?

Verfasst: Mi, 20.10.2010 19:57
von hylli
Naja, probieren geht über studieren, oder? Bevor man sich teure OCR-Software zulegt, sollte man vielleicht mal freie Alternativen testen, z.B.:

FreeOCR:
http://www.paperfile.net/

Cuneiform:
http://en.openocr.org/download/
http://www.cuneiform.ru/eng/

Hylli