tesseract
Version vom 9. Januar 2009, 23:38 Uhr von Michi (Diskussion | Beiträge) (New page: <b>tesseract</b> ist ein Texterkennungs-Programm. == Installation == $ <b>sudo apt-get install tesseract-ocr tesseract-ocr-deu tesseract-ocr-eng tesseract-ocr-fra</b> Die tesseract...)
tesseract ist ein Texterkennungs-Programm.
Inhaltsverzeichnis
Installation
$ sudo apt-get install tesseract-ocr tesseract-ocr-deu tesseract-ocr-eng tesseract-ocr-fra
Die tesseract-Dateien sind danach unter "/usr/share/tesseract-ocr/tessdata" installiert.
Verwendung
Zeichenerkennung in der Datei "file.tif". Das Ergebnis wird in die Datei "result.txt" geschrieben.
$ tesseract file.tif result
Weblinks
- Vorlage:enwi
- TrainingTesseract (How to use the tools provided to train Tesseract for a new language) (code.Google.com)
- Tesseract wrapper script for almost any image (Sourceforge.net) - Skript