タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

OCRに関するaminisiのブックマーク (2)

  • 数値認識 with python-tesseract - It’s a piece of cake.

    PIL(Python Image Library)の導入の続き さて、前回のエントリで画像を読み込んだり、簡単な加工をすることは出来るようになりました! 今回は、私が目的とする画像から数値(と簡単な演算子)を抽出する方法についてです〜。 ターゲット画像はこちら。 このJPEG画像から、数値を認識します〜。 で、認識に使うのはこちら! tesseractってのはGoogleで開発されてるC#製の文字認識エンジンだそうです。 それをpythonから使えるようにするラッパークラスがpython-tesseract。 python-tesseract 様々な環境用に導入方法が記入されてますが、 私はmac osx+brewでやりたいので、以下を参照。 osx10.8用らしいですが、私の10.7環境でも大丈夫でした。 (10.7用のwikiはmacport使う方法だったので。。。) How to c

    数値認識 with python-tesseract - It’s a piece of cake.
    aminisi
    aminisi 2013/04/22
  • tesseract-ocr parameters in 3.02 version | sk-spell

    back to tesseract-ocr-en „Tesseract is extremely flexible, if you know how to control it. There is a large number of control parameters to modify its behaviour. While these change from time to time, most of them are fairly stable.“ (Tesseract ControlParams wiki) If you want to get all list of parameters (variables) with its description and default values, you have to search tesseract code. Or cont

    aminisi
    aminisi 2013/04/22
  • 1