[B! review][OCR] myrmecoleonのブックマーク

Google Driveで画像を開いたと思ったら文字が全て書き起こされているという事態に衝撃の人々「マジかよ!」「あ!ホントだ」

マコなり社長 @mako_yukinari あ…ありのまま今　起こった事を話すぜ！「おれは　Google Driveで画像を開いたと思ったら　いつのまにか文字がすべて書き起こされていた」な…　何を言っているのか　わからねーと思うがおれも　何をされたのか　わからなかった… pic.twitter.com/DFGD03VH9z 2018-02-01 09:46:18

myrmecoleon 2018/02/02

リンク

無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね

昨日ツイッターのフォロワーさんがTLで「人を殴ったらかなり痛いくらいの紙書類の束渡されて、一晩で再編集とか死ぬる」とおっしゃってまして、まだまだ紙ベースの業務進行ってありますしPCに取り込んで効率的にさばくにはどうしたらいいだろうなーと思いまして。調べてみたところ、GoogleDriveでもテキストスキャンした画像ファイルをOCR変換する機能があるらしくちょっとサンプル作って試して見ましたので本日はそのレビューを。【追記】縦書き版の検証記事も書いときました。あわせて参考にどうぞ。 GoogleDriveOCR、縦書きだったらどうなのよ？ Google Drive OCRの使い方GoogleDrive利用するにはとりあえずGoogleアカウント必要なのでない方はまずそちらのご用意を。GoogleDriveの導入については過去にサービス開始したオンラインストレージ『Google Driv

myrmecoleon 2012/11/16

リンク

経験上、OCR変換が80%以上の精度だと、検索でヒットする確率は95-98%の確率となーる - 電子化

電子化業界では、なぜか、「80%以上の精度」にこだわります。通称「80%ルール」です。 Our experience suggests that should the word accuracy be greater than 80%, then most fuzzy search engines will be able to sufficiently fill in the gaps or find related words such that a high search accuracy (>95-98%) would still be possible from newspaper content because of repeated significant words. http://www.dlib.org/dlib/july09/munoz/07munoz.html とい

myrmecoleon 2009/09/14

リンク

知識ベースに基づいた図書目録カードの理解 | CiNii Research

myrmecoleon 2009/08/29

リンク

グーグル和解問題を国会図書館の動きから考える（2） | 「黒船」グーグルが日本に迫るデジタル開国 | ダイヤモンド・オンライン

国会図書館とグーグルのデジタルデータは似て非なるものここまで「本」のデジタル化という表現をしてきましたが、そのデジタル化の具体的な内容については説明していませんでしたので、今回は「デジタル化の中身」を取り上げたいと思います。グーグルでのデジタル化と、現段階における国会図書館のデジタル化とはその実態においてかなりの違いがあるからです。前回、国会図書館は約15万冊の蔵書のデジタル化を終え、今回の補正予算によって新たに75万冊の蔵書デジタル化を進める計画が進行中であることを説明しました。この国会図書館のデジタル化データは、現段階では全て画像となっています。「本」のページをスキャンしたイメージが画像データとして保存されている、ということです。もちろん、「本」のタイトルや著者名、発行年月日といった情報は別途デジタルデータ化され、画像データと関連付けて保存されています。国会図書館が提供してい

myrmecoleon 2009/07/15

「OCR…最大のネックはどうやら「権利者の意向」」

リンク

白黒二値画像とグレイスケール画像とで、OCRの正確さに差はあるか？（Nz）

ニュージーランド国立図書館が、2001年から実施している新聞デジタル化プロジェクト（ウェブサイト“Papers Past”で公開中）に関連して、デジタル化した画像をOCRを使ってテキスト化する際に、白黒二値（bitonial）画像とグレイスケール（greyscale）画像とで正確さにどの程度相違があるかを調査した結果を、D-Lib Magazine誌2009年3/4月号で発表しています。これによると、白黒二値の方が少し正確性が高いが、双方に有意な差は見られなかったとのことで、プロジェクトチームは同館に対し、当面は白黒二値でのデジタル化を続けることと、継続的に関連情報を収集しデジタル化方針をレビューすることを勧告しています。 Tracy Powell ; Gordon Paynter. Going Grey?: Comparing the OCR Accuracy Levels of Bit

myrmecoleon 2009/03/18

「白黒二値の方が少し正確性が高いが、双方に有意な差は見られなかった」日本語だとどうなのかな。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (13)

reviewとOCRに関するmyrmecoleonのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス