tesseract

Aus Mikiwiki
Version vom 9. Januar 2009, 23:38 Uhr von Michi (Diskussion | Beiträge) (New page: <b>tesseract</b> ist ein Texterkennungs-Programm. == Installation == $ <b>sudo apt-get install tesseract-ocr tesseract-ocr-deu tesseract-ocr-eng tesseract-ocr-fra</b> Die tesseract...)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

tesseract ist ein Texterkennungs-Programm.

Installation

$ sudo apt-get install tesseract-ocr tesseract-ocr-deu tesseract-ocr-eng tesseract-ocr-fra

Die tesseract-Dateien sind danach unter "/usr/share/tesseract-ocr/tessdata" installiert.

Verwendung

Zeichenerkennung in der Datei "file.tif". Das Ergebnis wird in die Datei "result.txt" geschrieben.

$ tesseract file.tif result

Weblinks