Tune in for episodes about AI, intelligent automation, and business.
README.md Attention-based Extraction of Structured Information from Street View Imagery A TensorFlow model for real-world image text extraction problems. This folder contains the code needed to train a new Attention OCR model on the FSNS dataset dataset to transcribe street names in France. You can also use it to train it on your own data. More details can be found in our paper: "Attention-based E
以前、お仕事でクレジットカードをカメラで撮影し、そこからカード番号を読み取るプログラムをOpenCVを使って開発しました。 ただ、そのお仕事はお客様の都合で採用には至らず、作りっぱなしのまま放置してました。 が、せっかく作ったのに誰にも使われないままというのももったいないので、ソースごと公開してしまいます。 (ちなみに、この案件の時期と博士取得の公聴会時期が重なって、非常にしんどい思いをしたのも良い思い出) https://github.com/takmin/CreditNumberRecognizer クレジットカードは普通の文字認識と違って、カード自体に色々な模様がついてしまっていて、しかも数字部分が浮かし彫りだったりするため、二値化してOCRにかけるようなわけにもいきません。 なので、開発にあたっては、背景テクスチャがある中で1文字1文字切り出す部分と切り出した文字を認識する部分を自
This comparison of optical character recognition software includes: OCR engines, that do the actual character identification Layout analysis software, that divide scanned documents into zones suitable for OCR Graphical interfaces to one or more OCR engines Software development kits that are used to add OCR capabilities to other software (e.g. forms processing applications, document imaging managem
アプリ名:KYBER(Ver.3.0.2) 金額:無料(2012年9月8日時点) カテゴリ:ツール 開発:O-RID 使用端末:LYNX 3D SH-03C おすすめ度:★★★★☆ スマートフォンのカメラで撮影し、書いた内容を取り込むことができるノートやペンが近頃増えており、文具コーナーを賑わせている。そうした中でも、他のノートやペンと一線を画す機能を備えているのが「KYBER」だ。 KYBERの大きな特徴は、ノートに書いたり、ペンで囲んだりした内容を、写真のまま保存するだけでなく、その内容を全てデジタルのテキストに変換してくれる、すなわちOCR機能を備えている点にある。しかもKYBERのOCRは、機械で自動的に文字に変換するのではなく、人が直接アナログの文字を読んで、デジタルの文字に変換する「人力OCR」というべきもの。変換に時間はかかるものの、その分文字変換の精度が非常に高いのだ。 仕
A pretty amazing piece of JavaScript dropped yesterday and it’s going to take a little bit to digest it all. It’s a GreaseMonkey script, written by ‘Shaun Friedle‘, that automatically solves captchas provided by the site Megaupload. There’s a demo online if you wish to give it a spin. Now, the captchas provided by the site aren’t very “hard” to solve (in fact, they’re downright bad – some examples
iPhoneでも有名なので知っている方は多いと思うが、CamCardというアプリを使ったことはあるだろうか。 CamCard Lite(名刺認識王 日本語中国語韓国語 - IntSig Information Co.,Ltd このアプリは名刺をAndroidのカメラで撮影しその後OCR処理で文字を認識し、それを文字データに変換して保存管理できるものだが、何が凄いってこのアプリのOCRの認識精度が素晴らしく、かなりの小さな、例えば名前の下の方に書く会社の住所等まで殆ど正確に認識する。※1 まだ使ったことがないのであればLite版に機能の制限は無いので是非一度使ってみることをお勧めする※2 CamCardのOCR機能にすっかり感心したが、ところでAndroidで使えるOCRそれも日本語を認識できるライブラリィは無いのだろうか。 Tesseract-android-tools - Hosting
Python から Tesseract を利用するための python モジュールが以下のサイトにおいて公開されている。 python wrapper class for tesseract OCR (Linux & Mac & Cygwin) http://code.google.com/p/python-tesseract/ プログラム例はこんなに短い! # -*- coding: utf-8 -*- #from __future__ import print_function import tesseract api = tesseract.TessBaseAPI() api.SetOutputName("outputName"); api.Init(".","eng",tesseract.OEM_DEFAULT) api.SetPageSegMode(tesseract.PSM_A
Tesseract のホームページ: http://code.google.com/p/tesseract-ocr/ バージョンには 2.04 と 3.00 が存在するが,とりあえず今回は 3.00 を導入してみる. 必要なファイルのダウンロード http://code.google.com/p/tesseract-ocr/ から以下の3種類のファイルを落とす. tesseract-3.00.tar.gz eng.traineddata.gz jpn.traineddata.gz ここで eng.traineddata.gz は必須の言語データである. インストール for Ubuntu 11.04 手順は http://code.google.com/p/tesseract-ocr/wiki/ReadMe に書かれているとおり. 準備として各種パッケージを導入する. $ sudo apt
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く