knuspermagier.de
Er bloggt noch? Krass!

Kassenbon OCR

Seit Jahren habe ich das unrationale Verlangen irgendwann mal alle Kassenbons, die ich in den Jahren gesammelt habe zu digitalisieren und per OCR auswertbar zu machen. In welchem Monat kaufte ich besonders viel Klopapier? Wie haben sich die Preise entwickelt?

Irgendwann machte ich schonmal einen versuch mit Tesseract, der führenden Open Source OCR-Lösung, aber wie wir wissen muss man da viel rumtüfteln um die Ergebnisse gut zu bekommen. Darauf hatte ich natürlich keine Lust. In Anbetracht der Tatsache, dass der Nutzen meiner Kassenbonstatistik wahrscheinlich gegen null konvergiert, ist jede darauf verschwendete Minute wahrscheinlich auch ziemlich... verschwendet.

Im Büro beschäftigen wir uns auch gerade etwas mit OCR und da probierte ich letztens mal Googles Cloud Vision API aus und sah ganz gute Ergebnisse für unseren Einsatzzweck — also fotografierte ich heute mal einen Kassenbon und lud ihn hoch.

Screen-Shot-2016-10-28-at-12.59.36.png

Insgesamt war die Erkennung schon ganz gut, nur leider hasst er anscheinend die Zahl 1. Das ist natürlich schade. Ich versuchte kurz das Bild etwas zu optimieren, durch Kontrastanpassungen und so, aber das brachte auch alles nichts. Ich verschiebe dieses Projekt also wieder für ein paar Jahre in die Zukunft.

(War ein Spontan-Einkauf, daher die Tragetaschen.)

Kommentare, Feedback und andere Anmerkungen?
Schreib mir eine E-Mail 🤓