タグ

ocrに関するdecoy2004のブックマーク (21)

  • 画像内の日本語テキストを抽出できる「Online OCR」が無料なのに便利すぎる

    Online OCRとは Online OCRは、46ヶ国の言語に対応して画像からテキストを抽出することができる無料のオンラインOCRツールです。 登録なしでの利用 現在、登録なしの状態で、15MBまでなら以下の形式の単一ファイルを読み込むことができます。 PDF (単一ページ) TIF/TIFF (単一ページ) JPEG/JPG BMP PNG GIF そして、以下の形式で出力することができます。 Microsoft Excel (xlsx) Microsoft Word (docx) プレーンテキスト (txt) 登録なしでも、ライトユーザーであれば十分すぎるくらい便利です。 無料登録をすると Online OCRは、登録しなくても十分便利なのですが、無料登録を行うことにより、さらにできることの幅が広がります。 以下の形式のファイルを200MBまで読み込むことができるようになります。

    画像内の日本語テキストを抽出できる「Online OCR」が無料なのに便利すぎる
  • 自炊pdfの主な難点

    1. OCR性能の違いがあり、日語OCRにかんしてAcrobatは現在は暫定王者である。 が、検証能力の公平さにおいて疑わしい比較記事があることで(ex. http://monomania.sblo.jp/article/55737163.html )その実態は周知されていない。 2. OCR性能にかかわらず、スマフォ/タブレットでのビューアアプリで、OCR読み込み/ハイライト処理/上書き保存能力 を万全に備えたものが実は 存 在 し な い 続きを読む

    自炊pdfの主な難点
  • Google Keepに画像をテキストに変換する機能が追加 | ライフハッカー・ジャパン

    サンディスクのmicroSDカード 512GBが40%OFF。写真や動画のデータ置き場はこれで良くない?【Amazonセール】

    Google Keepに画像をテキストに変換する機能が追加 | ライフハッカー・ジャパン
  • Engadget | Technology News & Reviews

    Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals

    Engadget | Technology News & Reviews
  • あの「イラつく文字認証」のおかげで年間250万冊もの本がデジタル化されている - ログミー[o_O]

    誰もが一度はイラっとさせられたであろう文字認証「CAPTCHA」。ユーザがコンピュータで無いことを確認するセキュリティ機能のひとつですが、近年、これを解読することは「のテキスト化」に協力することと同義になりました。同システムの開発者でクラウドソーシングも発案した起業家、Luis von Ahn(ルイス・フォン・アン)氏が、7億5,000万人が参加するプロジェクトが生まれたキッカケを語ります。(TEDxCMU 2011より) 誰もが一度はイラっとさせられるCAPTCHA(キャプチャ) ルイス・フォン・アン氏:このように、ゆがめられた文字の並びを読んで埋めるタイプのウェブフォームを見たことのある人は何人いますか? これを見て当にいらいらすると感じた人は何人いますか? はい、すばらしいですね。私がこれを発明しました。私がこれを発明したメンバーの1人です。 (会場笑) これはCAPTCHAと呼

    あの「イラつく文字認証」のおかげで年間250万冊もの本がデジタル化されている - ログミー[o_O]
    decoy2004
    decoy2004 2014/11/18
    『システムが答えを知っている単語を正しく読めたら、コンピュータは入力者を人間であると認識し、もう一つの単語も正しく読まれた可能性が高いと判断するのです。』
  • 画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

    Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c

    画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」
    decoy2004
    decoy2004 2010/04/18
    夕方の4時に画像を送り、戻ってきたのが夜の11時。ちょっと時間がかかっていますが、返信されたメールにはdoc,docx,pdfの三種類のファイルが添付されていました。日本語も読み取り。
  • Android携帯でとった写真をGoogle OCRでテキスト抽出できるアプリ「Google OCR by Pixelpipe」

    気になった文章を携帯カメラで撮り、デスクへ戻ってGoogle ドキュメントを開くとテキスト化されている。 まるで夢のようなお話ですが、どうやら実現してしまったようですw(※ただし英語に限ります。) 組織のマインドマップツールをマインドマイスターにすべき理由 伸びてる産業、会社、事業を紹介しまくるStrainerのニュースレターに登録!! Android の携帯カメラで撮った写真からGoogle OCRでテキストを抽出する便利アプリ正確にいうと、 Android携帯で撮った写真を、 Pixelpipeを介してGoogleドキュメントへアップロードすることによりGoogle OCRの機能を使って画像からテキストを抽出し、Googleドキュメント上にテキストとして保存できるようにするAndroid アプリ。 言語が英語に限られ、2行程度の文章に限られてしまうものの、将来性をものすごく感じさせる合

    Android携帯でとった写真をGoogle OCRでテキスト抽出できるアプリ「Google OCR by Pixelpipe」
    decoy2004
    decoy2004 2010/01/03
    ただし英語に限ります
  • 橋本商会 » scansnapと裁断機を買って本を電子化しまくる

    を解体する為にこの裁断機を買った。14000円ぐらい。 大型ペーパーカッター 裁断機 まだ必要ないので買ってないけど、替え刃も発見した。 コピー用紙500枚らくらくカット/人気 商品大型ペーパーカッター用『替え刃』 ジャンプぐらいの厚い雑誌でも切れる。このサイズの裁断機では妙に安い(他の半額程度)だが、そのかわり届いた時点で油でぬるぬるしている。 軍手とぞうきんを用意しておいて、よく拭いた。 刃の部分には茶色い油?が付着しているので、試しにいらないを裁断してみて油の拭き残しが無いか確かめる必要がある。 油がついた。(古ぐらしは新しいのを持っているので、2003年版を試し切りに使った) ■裁断する まずスキャンできるようにをバラバラにする。 表紙を外す しっかり押さえる 切る 切る。裁断機の刃が超鋭いので、あんまり力はいらない。 バラバラにしたをscansnapに入れる iPhon

    橋本商会 » scansnapと裁断機を買って本を電子化しまくる
    decoy2004
    decoy2004 2010/01/03
    Windows版はまともだが、Mac版は日本語と英語どちらかしか選べない。日本語でOCRをかけるとローマ字が全角になってしまう。
  • Google Docs にテキストを OCR する機能が追加予定?

    Perform OCR with Google Docs – Turn Images Into Editable Documents まだユーザーインターフェースそのものに組み込まれてはいないようですが、Google Docs に OCR 機能が追加されるのではないかという記事が Digital Inspiration で紹介されています。 この機能は Document List Data API の例として公開されているもので、こちらのフォームを利用して画像をアップロードすると、テキストが認識されて自動的に Google Documents に変換されます。 現在の所英数字のみ 画像はそれなりに高解像度の必要があります。1文字ごとに 10 px ほどの高さが目安 ファイルサイズは最大 10 MB、25 メガピクセル ファイルサイズに従って時間がかかります。500K くらいなら 15 秒、

    Google Docs にテキストを OCR する機能が追加予定?
    decoy2004
    decoy2004 2009/12/09
    # 現在の所英数字のみ # 画像はそれなりに高解像度の必要があります。1文字ごとに 10 px ほどの高さが目安
  • Google Docsで、画像ファイルのテキスト変換が可能になる?! | ライフハッカー・ジャパン

    PDF-to-Word-Converter』や『Zilla PDF to TXT Converter』など、PDFファイルをテキスト変換するツールは数々ありますが、PNG形式やJPG形式のファイルをテキスト化するツールは一歩遅れている印象...。そんな中、Google Docsでは、画像のテキスト変換機能の第一弾がリリースされたとのこと。まだテスト版ということもあり、機能の精度については十分でない面が多いですが、第一報としてお届けします。 GoogleDocsでは、アップロードしたPNGファイル・JPGファイル・GIFファイルなどの画像ファイルをテキストに変換するという機能(テスト版)がリリースされました。こちらのページでGoogle Docsへの「アクセスを許可」をすれば、デモ機能を実際に使ってみることができます。米ライフハッカー編集部が早速試してみたところ、米Lifehacker記事

    Google Docsで、画像ファイルのテキスト変換が可能になる?! | ライフハッカー・ジャパン
    decoy2004
    decoy2004 2009/10/03
    残念ながら現時点では日本語には未対応のようです。
  • http://www.scanr.com/JA/UseCaseDB.aspx

    decoy2004
    decoy2004 2009/07/29
    月額プラン¥315/月。容量無制限のオンラインストレージ,共有書類のPDF化・テキスト化・検索 (手書きOCRには非対応)
  • カメラ付き携帯がスキャナーやFAXになる新サービス

    scanR.jp 米scanR(スキャンアール)は、カメラ付き携帯電話で撮影したビジネス文書や名刺といった紙メディアをスキャンして、コピーやFAX送信できる日向けサービス「scanR.jp」を発表。30日よりサイトをオープンした。 同サービスは、カメラ付き携帯電話やデジタルカメラでビジネス文書やホワイトボードに書いた文章や図、領収書、名刺などを撮影し、指定されたメールアドレスに送信すると、送信先のサーバーで視認性を高めた画像に自動的に処理されるというもの。画像データはJPEG形式の元データとともに、PDF形式で保管される。 さらに、送信された画像データには自動的にOCR処理も行なわれ、画像データの内のテキスト情報から抽出されたキーワードでタグが付加される。このタグを利用して、「scanR.jp」やGoogle DesktopWindows Vistaなどデスクトップ検索ツールで画像検索

    decoy2004
    decoy2004 2009/07/29
    送信された画像データには自動的にOCR処理も行なわれ,画像内のテキスト情報から抽出されたキーワードでタグが付加される.タグを利用して,scanR.jpやGoogle Desktopなどデスクトップ検索ツールで画像検索が行なえる
  • 窓の杜 - 【NEWS】英語OCRプラグインに対応した定番画像ビューワー「IrfanView」v4.25

    プラグインを導入することで音声や動画も再生可能な定番の軽量画像ビューワー「IrfanView」の最新版v4.25が、16日に公開された。最新版の主な変更点は、ソフトに英語OCR機能を追加するプラグイン「OCR_KADMOS」に対応したこと。「OCR_KADMOS」プラグインは、プラグイン集「IrfanView 拡張プラグイン全DLL収録版」には含まれておらず、作者サイトの“PlugIns”ページからダウンロードすることで利用できる。 OCR機能は[Options]メニューの[Start OCR...]項目や[F9]キーから実行可能。実行すると表示中画像の文字列と思われる箇所がハイライトされたウィンドウが開く。ハイライト部分をクリックすると該当する箇所から認識されたテキストが別ウィンドウに表示される仕組み。 認識されたテキストはクリップボードにコピーするほか、TXTファイルに保存することも

    decoy2004
    decoy2004 2009/06/21
    ドイツ語やイタリア語など欧米各国の追加ファイルは用意されているが、日本語の追加ファイルは用意されていなかった。
  • 「Evernote」との連携でScanSnapを買わない理由がなくなった! - ネタフル

    既にエントリーにまとめられているようです。 ▼Mac+ScanSnap+Acrobatでお手軽名刺管理(検索も可!) そこで、ScanSnapとAcrobat Professionalを組み合わせて、あまり手間をかけずに名刺を管理してみることにする。Windows版のScanSnapなら、検索可能なPDF(透明テキストPDF)の出力機能が標準で備わっているからこんな苦労をしなくてもいいんだけどねえ(→Macモデルも、S1500M以降は検索可能なPDFの出力機能が備わっている)。 ▼ScanSnapで読み込んだ名刺を、iPhoneから検索する で、どうやって名刺を検索するかというと、Evernoteでメモを作り、PDFを貼り付けるだけ。iPhoneのクライアントでキーワードを入力支すると、ちゃんと検索できた! 複数のファイルをEvernoteに登録するには、Finderでファイルを選択し、E

    「Evernote」との連携でScanSnapを買わない理由がなくなった! - ネタフル
    decoy2004
    decoy2004 2009/06/05
    新モデルの「S1500M」では、Acrobatを使わずに、検索可能なPDFを直接書き出せるようになった
  • hirax.net::Office付属OCR機能で「板書画像を一発でPPTファイルにするRubyスクリプト」を作る

    最新記事(inside out)へ  | 年と月を指定して記事を読む(クリック!) / 2001/ 2002/ 2003/ 2004/ 2005/ 2006/ 2007/ 2008/ 2009/ 2010/ 2011/ 2012/ 2013/ 2014/ 2015/ 2016/ 2017/ 2018/ 2019/ 2020/ 2008年11月 を読む << 2008年12月 を読む >> 2009年1月 を読む 「ホワイトボード前で打ち合わせをして、打ち合わせ終了時にホワイトボードに書いた板書をプリントアウトして、後でパワーポイント資料を作り直す」といった作業をしたことがある人は多いと思います。あるいは、(印刷機能を持ったホワイトボードは高いですから)「ホワイトボードに板書した内容をデジカメやケータイで撮影しておいて、撮影画像をプリントアウトした後にパワーポイント資料を作ったり」、「撮影画

    decoy2004
    decoy2004 2008/12/29
    Office 2003以降に着いてくる"Microsoft Office Document Imaging"のOCR機能を使って(デフォルト設定ではインストールされないかもしれません)、「板書画像を一発でPPTファイルにするRubyスクリプト」を作ってみました。
  • ソフトの出来も上々で認識率も高い - 日経トレンディネット

    ところが、何度試してもうまくいかないので説明書を熟読したところ、なんと、Windows Vistaでは、上位置に止める使い方しかサポートしてないというのだ。なんとも、残念と言うか何と言うか……。もはや、Windows Vistaのユーザー数はWindows XPを超えたとも言われるので、アップデータで対応してほしいところだ。また、Macにも対応すれば言うことなしだ。 ユニット体を取り付けると、用紙の上のほうが使えなくなるのだが、2~3cm程度なので妥協しよう。逆に言うなら、あまりにも小さなメモ用紙などでは使う意味がない。最低でもA5サイズ以上で利用したい。 さて、肝心の文字認識だが、手順は簡単で読み取ったデータを右クリックして、コンテキストメニューの「テキスト変換」を実行すればよい。自動的にOCRソフト「MyScript Notes Lite」が起動して読み取りが始まる。認識率は想像以上

    ソフトの出来も上々で認識率も高い - 日経トレンディネット
    decoy2004
    decoy2004 2008/11/20
    変換したテキストファイルを元の手書きメモと関連付けて記録できない点だ。つまり、大量に手書きメモがたまっても、内容を検索して探せないのだ。
  • Evernote特集『OCR精度はどの程度あるのか』

    前回はEvernoteの簡単なレビューを行いました。さらに詳しい操作方法についてはGoogle教授に聞いてもらって、今回はEvernoteのミソとなるOCR精度がどのくらいなのか実験してみました。 ・jpgファイルは『Paint.net』のjpg作成時の圧縮率を使い、100,75,50,30,10,5,1の7種類を用意。 ・検索語句を打ち込み、どのくらいまで読み取れるのかをみてみる。 サンプルとしたのは『Stay hungly. Stay Foolish』で有名なスティーブジョブズのスピーチ冒頭部分を画像として取り込みました。 ■まずは『Jobs』。タイトルに含まれているので、なんとすべての画像で読み取りをしてくれました。 ■次に『commencement』小さい字ですが、よく読んでくれました。 ■さらに『graduation』これは圧縮率10ですが、小さい字なのによく読めています。 ほか

    decoy2004
    decoy2004 2008/11/09
    小さい字なのによく読めています。
  • 画像内の文字をコピー&ペーストする

    資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを

    画像内の文字をコピー&ペーストする
    decoy2004
    decoy2004 2008/10/24
    無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。
  • スクリーンショット+OCRを実現する『Kleptomania』 - 100SHIKI ~ 世界のアイデアを日替わりで ~

    StructuRiseのKleptomaniaはちょっと便利そうだ。 このソフト、いわゆるスクリーンショットを撮ってくれるのだが、同時にOCR的な機能をもっているところがよい。 つまり、撮ったスクリーンショットに映っている文字を自動的に認識して、テキストに変換してくれるのだ。 そのままテキストをコピーできないような画面の説明をするときに重宝するだろう。 いまだにマニュアルでテキストを書き写しているような作業は他にないだろうか。ちょっと考えてみると新しいアイディアが浮かんでくるのかもしれませんね。

    スクリーンショット+OCRを実現する『Kleptomania』 - 100SHIKI ~ 世界のアイデアを日替わりで ~
    decoy2004
    decoy2004 2008/09/02
    撮ったスクリーンショットに映っている文字を自動的に認識して、テキストに変換してくれるのだ。
  • Evernoteで自分の脳を拡張する(プライベートベータご招待)

    Hey, folks, welcome to Week in Review (WiR), TechCrunch’s regular newsletter covering the past week in happenings around the tech sphere. Winter’s finally arrived, judging by the NYC weath

    Evernoteで自分の脳を拡張する(プライベートベータご招待)
    decoy2004
    decoy2004 2008/08/02
    サービスは最大容量5GBまで無料だ。同社は、容量を追加してフィルタリングやイメージ認識技術によって機能強化されたプレミアムサービスで、収益化をはかりたいと考えている。