タグ

ocrに関するkoda3のブックマーク (8)

  • [それWeb] HTMLでデバイスのカメラから写真をとり、PHPでOCRにかけて文字列を返す - Qiita

    それWebでできるよ! こんにちは皆さん スマホのカメラを使って写真を撮ると、なんと文字列が返ってくる。 そんなアプリがあるような気がするのですが、現在ではブラウザでもカメラにアクセスできるので、わざわざアプリにする必要もなく ( OSの差異にあまり煩わされることなく ) Webアプリで簡単に作ることができるのではなかろうか、と考えました。 考えたらやるしか無いでしょう。 休日を利用して、ちゃっちゃか作ってみました。 あ、いつものようにPHP使いますね TL;DR 今回の見所は以下のとおりです。 HTML + JavaScriptでカメラを取る tesseract-ocrをインストールしたコンテナを作る PHPでOCRする 何がやりたいのか 掲示板とかで無線wifiのssidとか貼ってあるとき、いちいち手打ちするの面倒なんで、カメラで取ってそのままはっつけられるようになったら嬉しいのになぁ

    [それWeb] HTMLでデバイスのカメラから写真をとり、PHPでOCRにかけて文字列を返す - Qiita
    koda3
    koda3 2017/09/20
  • Docker

    koda3
    koda3 2017/03/15
  • 日本語OCRライブラリNHocrを利用してみる - Qiita

    NHocrは日語用OCR(光学文字認識)用ライブラリ。 割と世界的に有名なtesseract-ocrより日語の性能は良いということで使ってみることにした。 ちなみに、どちらもライセンスはApache License V2.0。 性能を評価してくれているブログ( http://g86.dbcls.jp/~yag/wordpress/archives/1351 )を見つけたのだけれど、これにインストールできなかったとかいてあるとおり、すんなりとはインストールできなかったのでインストールの仕方を書いておく。 ./configureでのfailの解決 $ configure checking for a BSD-compatible install... /usr/bin/install -c checking whether build environment is sane... yes

    日本語OCRライブラリNHocrを利用してみる - Qiita
    koda3
    koda3 2017/03/13
  • Tesseract-OCR 3.04 を試してみる - 今日も微速転進

    久しぶりに技術系の話題を。 オープンソースのOCRエンジン、Tesseract-OCRの新バージョンがリリースされているので試してみました。 比較対象は3.02.02。既存環境を破壊したくないので、対照実験になっていませんが勘弁してやってください。 開発元のwebサイトですが、GoogleCode から GitHubに移転しています。 tesseract-ocr · GitHub 準備など 比較条件 環境構築 Yosemite Arch Linux 認識対象データ 注意点 評価結果 (a) 3.02.02 (b) 3.02.02 + 日語向け設定 (c) 3.04 (d) 3.04 + 日語向け設定 (e) 3.04 + 最新言語辞書 その他 まとめ 参考URLなど 準備など 比較条件 手元の旧版(3.02.02)と簡単に認識結果を比較してみたいと思います。 ver. 3.02.02

    Tesseract-OCR 3.04 を試してみる - 今日も微速転進
  • 62言語超対応のOCR「tesseract.js」がJavaScriptに移植、機械学習にも対応 【@maskin】 | TechWave(テックウェーブ)

    1990年代初頭から記者としてまた起業家として30年以上にわたりIT業界のハードウェアからソフトウェアの事業創出に関わる。シリコンバレーやEU等でのスタートアップを経験。日ではネットエイジ等に所属、大手企業の新規事業創出に協力。ブログやSNSLINEなどの誕生から普及成長までを最前線で見てきた生き字引として注目される。通信キャリアのニュースポータルの創業デスクとして数億PV事業に。世界最大IT系メディア(スペイン)の元日編集長を経て現在に至る。 北米を中心に全世界でJavaScriptへの対応熱止まらない。 今回も知る人ぞ知るオープンソースの文字認識エンジン「Tesseract-OCR」が、JavaScriptに移植され話題になっている。 以下は「tesseract.jp」のデモ画像。ウェブ上で画像の取得から一連の文字認識のプロセスが確認できる。 「Tesseract-OCR」は、も

    62言語超対応のOCR「tesseract.js」がJavaScriptに移植、機械学習にも対応 【@maskin】 | TechWave(テックウェーブ)
  • 画像認識でアプリケーション操作の自動化を実現!Sikuliがあまりに革命的で興奮した

    アプリケーションの自動操作をスクリプトで実現するために、Sikuliを調べてみました。 Sikuliとは# Sikuliとは、 OpenCVをつかった画像認識 OCRをつかった文字認識 で、アプリケーションの自動操作を実現するためのツール、スクリプト言語。 Sikuli Script - Home Javaで実装されているため、JVM上で動作するスクリプト言語から利用できる。 スクリプト編集のためのIDEは、画像とプログラム言語を合わせて表示できるという、革命的なソフトウェア。久々に、スゴイ!とおもったソフトウェアだ。 インストール# sikuli-setup.jarをダウンロードして、インストーラをダブルクリックで起動するだけ。 すると、いろいろとインストールオブションがきかれる。JRubyを選択。 slkulix.jarをダブルクリックで起動。IDEが立ち上がる。 インストールは、以下

    画像認識でアプリケーション操作の自動化を実現!Sikuliがあまりに革命的で興奮した
    koda3
    koda3 2015/09/08
  • PC

    パーソナルコンピューティングの40年 VRゴーグルの普及でメタバースも急増、ChatGPTで世界の注目を集めた生成AI 2023.12.28

    PC
  • まちみのな::C#で文字認識を行う

    Microsoft Office をインストールすると、実は OCR ソフトがついてきます。C# からの利用も簡単です。下記のコードを、Visual C# Express 2005 または 2008 で作成し、参照設定に、 Microsoft Office Document Imaging 11.0 Type Library (MDIVWCTL.DLL) を追加してビルドしてください。 [:ボックス1:] ソースコードのダウンロード (Visual C# Express 2008 用) v1.0 (2008/07/21) using System; using System.Text; /// /// OCR witMicrosoftR Office By Martin Welker (CodeProject) /// に基づく Office 2003 に依存したOCR処理。 /// 

    koda3
    koda3 2015/01/12
  • 1