PIL(Python Image Library)の導入の続き さて、前回のエントリで画像を読み込んだり、簡単な加工をすることは出来るようになりました! 今回は、私が目的とする画像から数値(と簡単な演算子)を抽出する方法についてです〜。 ターゲット画像はこちら。 このJPEG画像から、数値を認識します〜。 で、認識に使うのはこちら! tesseractってのはGoogleで開発されてるC#製の文字認識エンジンだそうです。 それをpythonから使えるようにするラッパークラスがpython-tesseract。 python-tesseract 様々な環境用に導入方法が記入されてますが、 私はmac osx+brewでやりたいので、以下を参照。 osx10.8用らしいですが、私の10.7環境でも大丈夫でした。 (10.7用のwikiはmacport使う方法だったので。。。) How to c