{"id":29,"date":"2007-07-17T14:20:00","date_gmt":"2007-07-17T12:20:00","guid":{"rendered":"http:\/\/self.mestrona.net\/wp\/wordpress\/?p=29"},"modified":"2007-07-17T14:20:00","modified_gmt":"2007-07-17T12:20:00","slug":"ocr-unter-linux","status":"publish","type":"post","link":"https:\/\/s3lf.de\/blog\/2007\/ocr-unter-linux\/","title":{"rendered":"OCR unter Linux"},"content":{"rendered":"<p>Wir w&#252;rden gerne unsere Eingangsbelege halbautomatisch via OCR erfassen. Deshalb habe ich mich nach den OCR-M&#246;glichkeiten unter Linux umgeschaut.<\/p>\n<p>Es gibt zwar einige Software (gocr, ocrad, tesseract) die leide jedoch schon relativ alt und nicht mehr auf dem aktuellen Stand der Technik ist. Ocrad hat den Vorteil, dass es immerhin auch deutschen Text (d.h. auch Umlaute) erkennen kann. Das kann mein aktueller Favorit &#8211; tesseract &#8211; leider noch nicht. Ansonsten scheint tesseract aber die genausten Ergebnisse zu liefern.<\/p>\n<p>Und jetzt die gute Nachricht: Google hat sich vor kurzem der Weiterentwicklung von tesseract angenommen: Tesseract wird zu Google-Code umgezogen (<a href=\"http:\/\/code.google.com\/p\/tesseract-ocr\/\">Projektseite<\/a>) und f&#252;r das Wochenende (21.7.) ist die Version 2.0 &#8211; welche unter anderem auch Deutsch unterst&#252;tzt &#8211; angek&#252;ndigt. Ich gespannt auf die Verbesserungen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wir w&#252;rden gerne unsere Eingangsbelege halbautomatisch via OCR erfassen. Deshalb habe ich mich nach den OCR-M&#246;glichkeiten unter Linux umgeschaut. Es gibt zwar einige Software (gocr, ocrad, tesseract) die leide jedoch schon relativ alt und nicht mehr auf dem aktuellen Stand der Technik ist. Ocrad hat den Vorteil, dass es immerhin auch deutschen Text (d.h. auch [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[13,5],"tags":[],"class_list":["post-29","post","type-post","status-publish","format-standard","hentry","category-firma","category-linux"],"_links":{"self":[{"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/posts\/29","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/comments?post=29"}],"version-history":[{"count":0,"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/posts\/29\/revisions"}],"wp:attachment":[{"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/media?parent=29"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/categories?post=29"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/s3lf.de\/blog\/wp-json\/wp\/v2\/tags?post=29"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}