Hallo Reiki,
wie Sanne schon schrieb ist das Umwandeln mit OOo nicht möglich, dazu benötigst Du ein Programm zur Texterkennung. Wen Du einen Scanner hast, war vielleicht Omni Page oder der Abbyy FineReader dabei. Ansonsten versuch's doch mal mit TopOCR (http://www.topocr.com für Windows) - kostet nichts.
Viele Grüße
Martin
jpg in text umwandeln mit oo möglich?!
Moderator: Moderatoren
Re: jpg in text umwandeln mit oo möglich?!
Such nach (freien) Texterkennungs- bzw. OCR (Optical Character Recognition) Programmen. Neben dem genannten z.B. auch FreeOCR (Windows) oder GOCR (Linux, inzw. wohl auch für Windows).
- Constructus
- *******
- Beiträge: 1610
- Registriert: Mo, 21.01.2008 18:08
- Wohnort: 20 Jahre Brilon - 40 Jahre Essen- Steele
Re: jpg in text umwandeln mit oo möglich?!
Netter Gruß in die Runde,
per Tipp "van andern"
bin ich auf ein tool gestoßen, das zumindest unter Linux pdf direkt in Text (.txt) verwandelt.
"man pdftotext" auf der Anwenderkonsole kann hier vielleicht hilfreich sein.
Die Formatierungen des pdf sind im txt weitgehend weg, man kann allerdings mit Optionen auch vielleicht noch mehr erreichen. Der Pfad zur Quelldatei sollte der kürzeste Weg sein, Umleitungen will das tool nicht handhaben. {Bspw. funktioniert pdftotext /home/...Dateiname.pdf, nicht aber pdftotext media:/sda3/...Dateiname.pdf}
Viel Erfolg von
Constructus
per Tipp "van andern"

"man pdftotext" auf der Anwenderkonsole kann hier vielleicht hilfreich sein.
Die Formatierungen des pdf sind im txt weitgehend weg, man kann allerdings mit Optionen auch vielleicht noch mehr erreichen. Der Pfad zur Quelldatei sollte der kürzeste Weg sein, Umleitungen will das tool nicht handhaben. {Bspw. funktioniert pdftotext /home/...Dateiname.pdf, nicht aber pdftotext media:/sda3/...Dateiname.pdf}
Viel Erfolg von
Constructus
EDV ist wunderbar - o Wunder, wenn sie funktioniert! {°L*}
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Re: jpg in text umwandeln mit oo möglich?!
Da hast Du aber einen Denkfehler, Constructus.
pdftotext funktioniert nur mit pdf, die aus Textobjekten bestehen.
Hier geht es aber um ein jpeg, und das ist für den Computer doch erst mal immer noch eine Ansammlung von Pixeln ohne jegliche Textinformation.
An der Tatsache kann auch der Export in ein pdf nichts ändern. Dann ist es nämlich ein pdf mit eingebettetem jpeg.
Im Adobe Acrobat (Standard, Pro oder Enterprise) gibt es eine OCR-Funktion, die ist aber nach meiner Erfahrung (Acrobat 6-8) nicht sonderlich gut in ihrer Erkennungsrate, und eine Edition von Abbyy Finereader oder OmniPage für den Hausgebrauch (und in der Windows-Welt) ist dann auch noch billiger.
pdftotext funktioniert nur mit pdf, die aus Textobjekten bestehen.
Hier geht es aber um ein jpeg, und das ist für den Computer doch erst mal immer noch eine Ansammlung von Pixeln ohne jegliche Textinformation.
An der Tatsache kann auch der Export in ein pdf nichts ändern. Dann ist es nämlich ein pdf mit eingebettetem jpeg.
Im Adobe Acrobat (Standard, Pro oder Enterprise) gibt es eine OCR-Funktion, die ist aber nach meiner Erfahrung (Acrobat 6-8) nicht sonderlich gut in ihrer Erkennungsrate, und eine Edition von Abbyy Finereader oder OmniPage für den Hausgebrauch (und in der Windows-Welt) ist dann auch noch billiger.
- Constructus
- *******
- Beiträge: 1610
- Registriert: Mo, 21.01.2008 18:08
- Wohnort: 20 Jahre Brilon - 40 Jahre Essen- Steele
Re: jpg in text umwandeln mit oo möglich?!
Hallo Christian,
Denkfehler? Hm, ich habe mich leider verleiten lassen, als ich mit der SuFu nach dem Thema "pdf in Text" hier im Forum gesucht habe. Da kamen in einem anderen Thread auch Hinweise, daß man das JPG erst in ein PDF umwandeln solle. Da hab ich im Moment erst garnicht beachtet, daß damit natürlich ein OCR erforderlich ist. Jetzt, wo Du's sagst...
Abbyy Fine Reader soll mittlerweile auch in einer Linux- Version (aber immer noch kommerziell) verfügbar sein (nicht nachgesucht). Aber auch ein russisches Tool ist neuerdings bekannt, ebenso für WIN wie für Linux: Cuneiform {X1} {X2}. Ocropus i. V. m. Tesseract sind ja vielleicht schon bekannt? Allerdings ist es möglich. daß meistens tiff statt JPG als Basis für erfolgreiches OCR verlangt wird.
Unaufgepaßt
Constructus
Denkfehler? Hm, ich habe mich leider verleiten lassen, als ich mit der SuFu nach dem Thema "pdf in Text" hier im Forum gesucht habe. Da kamen in einem anderen Thread auch Hinweise, daß man das JPG erst in ein PDF umwandeln solle. Da hab ich im Moment erst garnicht beachtet, daß damit natürlich ein OCR erforderlich ist. Jetzt, wo Du's sagst...

Abbyy Fine Reader soll mittlerweile auch in einer Linux- Version (aber immer noch kommerziell) verfügbar sein (nicht nachgesucht). Aber auch ein russisches Tool ist neuerdings bekannt, ebenso für WIN wie für Linux: Cuneiform {X1} {X2}. Ocropus i. V. m. Tesseract sind ja vielleicht schon bekannt? Allerdings ist es möglich. daß meistens tiff statt JPG als Basis für erfolgreiches OCR verlangt wird.
Unaufgepaßt

Constructus
EDV ist wunderbar - o Wunder, wenn sie funktioniert! {°L*}
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"
Freie Offices auf div. Linuxen + 3 VBoxen mit WIN2K
|| LibO + AOO, auf Linux und WIN2K; portable OO & Co. auf WIN
Genaue Typisierung unmöglich, alles ist "im Fluß"