並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 1603件

新着順 人気順

OCRの検索結果361 - 400 件 / 1603件

  • 槻ノ木隆のPC実験室 ドキュメントスキャナ「PFU ScanSnap S1500」を試す

    ドキュメントスキャナの定番の1つ、PFUのScanSnapであるが、2月2日に新モデルが発表となった。筆者のところにも評価機が廻ってきたので、早速試してみたい。 ●エッジを強調したボディに パッケージは黒がベースで、本体はS500が黒&赤、S510が黒&オレンジだったのが、S1500では黒&シルバーに変わった(写真01)。もっとも、Macintosh向けはシルバー1色なので、ひょっとするとMacintosh向けのパッケージカラーはシルバーベースかもしれない。 同梱されるものは以前と大きく変わらない(写真02)。本体は微妙に大きくなったが、使い勝手を損なうほどのものではない。ただ以前が丸みを帯びた形状だったのに対し、S1500はもう少しエッジが強調されたデザインになっているのが特徴的だ。ちなみに写真03は排紙トレイを閉じた状態での写真。このままでもスキャンは可能だが、スキャン後の紙は直接床に

    • 国会図書館が蔵書90万冊以上をデジタル化?! −国立国会図書館所蔵資料のデジタルアーカイブ整備費百数十億円を含む補正予算案、衆院通過/権利者の許諾なしで国会図書館所蔵資料の電子化を行える著作権改正法案も衆院全会一致で可決 - かたつむりは電子図書館の夢をみるか(はてなブログ版)

      Web上のニュース等ではまだ上がっていないようですが、5/13付けの朝日新聞で、今年度の補正予算案で国立国会図書館の蔵書デジタル化として計127億円が計上された、という報道がありました。 これは前年の100倍規模だそうです。 同館の蔵書は全部で917万冊。うち明治・大正期に刊行された書籍の一部、約14万8千冊をデジタル化してネットで公開しているが、蔵書の1.6%にすぎない。予算案が認められれば約92万冊、同館の国内図書の4分の1近くのデジタル化が終わる計算だ。 [朝日新聞.2009-05-13.朝刊.社会面.25ページ] 自分が確認したのは朝日新聞のデータベース「聞蔵IIビジュアル」版と筑波大学に所蔵されてた紙版ですが、こちらのリンク先にも途中まではほぼ同じ内容が掲載されています(ただし最後の1文が聞蔵版とリンク先では違って、聞蔵版ではGoogle Book Searchについての言及と国

        国会図書館が蔵書90万冊以上をデジタル化?! −国立国会図書館所蔵資料のデジタルアーカイブ整備費百数十億円を含む補正予算案、衆院通過/権利者の許諾なしで国会図書館所蔵資料の電子化を行える著作権改正法案も衆院全会一致で可決 - かたつむりは電子図書館の夢をみるか(はてなブログ版)
      • Google,HPの開発したオープンソースOCRエンジン「Tesseract」を公開

        米Googleは,オープンソース・コミュニティSourceForge.netで文字認識(OCR)エンジン「Tesseract」を公開した。Google最上級技術リード(Uber Tech Lead)のLuc Vincent氏が米国時間8月,公式ブログGoogle Code Blogへの投稿で明らかにしたもの。SourceForge.netのWebサイトから無償でダウンロードできる。 Tesseractは,米Hewlett-Packard(HP)が1985~1995年にかけて開発していたOCRエンジン。ネバダ州立大学ラスベガス校(UNLV)が1995年に開催したOCRソフトウエアの精度を評価するコンテストで,トップ3の成績を記録したという。しかしHPがOCR事業からの撤退を決めたことから,「Tesseractはほこりをかぶっていた」(Google)。 その後「HPの関係者がTesseract

          Google,HPの開発したオープンソースOCRエンジン「Tesseract」を公開
        • OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB

          関連研究 ChatGPTの”ふるまいの変化”を定量的に分析した結果 OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり 従来の課題 GPT-4Vは、従来のGPT-4が抱えていたいくつかの課題を解決する形で登場しました。 テキスト中心の処理能力 従来のGPT-4は、テキストデータの処理能力に特化しており、テキストベースの質問応答、文章生成、自然言語理解など、多くの用途で非常に有用でした。 しかし、裏を返せば画像や音声など他のメディア形式に対する対応が不足していました。テキストと画像が組み合わさったマルチモーダルなデータに対する処理能力が限定的でした。 画像入力とプライバシー GPT-4の画像データに対する安全な処理能力には限界がありました。例えばプライバシー保護の観点が

            OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB
          • Tesseract ocr

            Takuya MinagawaTechnical Solution Architect at Vision&IT Lab Co., Ltd.

              Tesseract ocr
            • 文具王のScanSnap&iPhone活用術

              「この手軽さって、デジカメ写真と同じだと思うんです」――。『文具王の「B-Hacks!」』を連載中の高畑正幸氏は、ScanSnapを使い倒しているMacユーザー。データのデジタル化と、データ関連ガジェットへの造詣も深く、最近はiPhone 3GをScanSnapで取りためたデータのビューワとして活用中だ。 なぜScanSnapなのか? それを尋ねた時の文具王からの返答が冒頭の言葉。文書のデジタル化という考え方が浸透してきた昨今だが、なぜScanSnapを選び、どのように使っているのかを聞いていく中に、デジタル化の神髄を見た。 僕はScanSnapが出た当初からのユーザーで、今使っているのが5台目です。もう7年になります。 当時からデジタル化願望はすごくあったので、連続スキャンできる道具がどうしても欲しくて。ドキュメント専用のスキャナとか、ADFが付いている複合機とかを試してきました。 そん

                文具王のScanSnap&iPhone活用術
              • NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN

                NHocrはオープンソースの日本語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。 SourceForge.JPの本プロジェクトでは、パッケージの提供に加えて、NHocrに関する日本語による文書提供などのユーザサポートを行います。 以下のサービスやアプリケーションでNHocrを試してみることができます。 * 日本語文字認識 (WeOCRサービス) * Capture2Text

                  NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN
                • TechCrunch | Startup and Technology News

                  In an interview at his home near Reykjavík, the entrepreneur-turned-VC shared thoughts on his ventures and the journey that led him from Unity to climate tech, a homecoming of sorts.

                    TechCrunch | Startup and Technology News
                  • Microsoft、iPhone/Android向けスキャンアプリ「Office Lens」公開

                    米Microsoftは4月2日(現地時間)、スキャンアプリ「Office Lens」のiPhone版をリリースしたと発表した。Android版もプレビュー版としてリリースした。日本語化されている。 Office Lensは、Microsoftが昨年3月にWindows Phoneアプリとしてリリースし、人気の高いアプリ。既にiOS/Android/Mac版が出ている同社のメモアプリ「OneNote」と連係し、端末のカメラで撮影したレシートや名刺、ホワイトボードなどの写真をクラウド上に保存できる。下図のように、斜めだったりパースがついた状態で撮影した文書でも、四隅を認識することで自動的に整形してくれる。 ドキュメントとして保存した場合は、OCRでテキスト化するので、後からキーワードで検索できる。筆者が試してみたところ、日本語も部分的にうまくテキストとして認識された。 撮影した画像は、OneN

                      Microsoft、iPhone/Android向けスキャンアプリ「Office Lens」公開
                    • GoogleドライブでOCRできることが知られていなかったようなのでもう一度解説する

                      先日、このようなまとめがアップされていて、多数のブクマを集めていました。 Google Driveで画像を開いたと思ったら文字が全て書き起こされているという事態に衝撃の人々「マジかよ!」「あ!ホントだ」 - Togetter これが、始まりのツィート。 あ…ありのまま 今 起こった事を話すぜ! 「おれは Google Driveで画像を開いたと 思ったら いつのまにか文字がすべて書き起こされていた」 な… 何を言っているのか わからねーと思うが おれも 何をされたのか わからなかった… pic.twitter.com/DFGD03VH9z — まこなり (@mako_yukinari) 2018年2月1日 なるほど、GoogleドライブのOCRって、意外にもまだまだ知られていなかった感じなんですね。 それでは、再度丁寧に解説してみたいと思います。 GoogleドライブでOCRというのは、私

                        GoogleドライブでOCRできることが知られていなかったようなのでもう一度解説する
                      • 無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する

                        はじめに 日々の業務作業で、画面や画像を見てその内容によって、その後の作業の流れや結果を変更する場面があります。そういった業務作業をPower Automate for desktopで自動化する際に、OCRのアクションを利用できます。 今回は、文字列が含まれた画像ファイルが複数入ったフォルダーを用意して、その中の各画像の文字列を抽出するサンプルフローを作成します。 [注意] アクションには、MicrosoftコグニティブのOCRの機能もありますが今回は使用しません。Azureアカウントなどは不要です。 「ファイル選択ダイアログ」アクションの後に「OCRを使ってテキストを抽出」アクションを使用するとデッドロックしてフリーズしてしまう問題があるようですので、ご注意ください。 フォルダー/素材の準備 まずはOCR読み込みのもととなる画像ファイルと、サンプル実行に必要なフォルダーを準備します。

                          無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する
                        • いざ調べ始めると大変、ネットにない古い情報を探すには

                          米Pew Research Centerの調査によれば、2023年10月の時点で10年前(2013年)のWebページの38%がアクセス不能であるという。 10年前といえばそこそこ昔だと感じるかもしれない。20代の人からすればまだ子供時代だろう。10年前のガジェット、例えばPCやスマホはすでに役に立たなくなっても、新しいものがそれに変われば問題ない。 だが情報はどうだろうか。われわれは常に最新の情報を求めており、うっかり古い情報をつかんでしまうと判断を誤る可能性が高くなる。その一方で過去の情報が無ければ、今の情報の価値が分からなくなるのも事実だ。データとしての年次変化やトレンドの変遷など、過去からのベクトルが追えなくなってしまえば、未来予測もできない。つまり情報は過去からの 連続性が無ければ、未来線が描けないということである。 Webページが失われていくということは、当時のトレンドが分からな

                            いざ調べ始めると大変、ネットにない古い情報を探すには
                          • Googleドライブで、画像やPDFの文字をテキストにするOCRにかける方法 | 経験知

                            ※本ページはプロモーションが含まれています 作成:2015/04/14 更新:2018/02/05 2014年7月にGoogleドライブのデザインが新しくなりました。 以前のGoogleドライブは設定をすると、画像やPDFをアップロードする際に画像内の文字を文書化するOCRにかけてくれるので重宝していました。 しかし、新しいGoogleドライブになるとアップロード時の設定が無くなり、アップロードしただけでは自動で文書化されなくなりました。 Googleドライブ右上の「歯車」→「設定」をクリックすると、 「アップロードしたファイルを変換する」 という項目があり、これにチェックを入れればアップロードした画像を自動解析してくれるかと思ったのですが、アップロードしただけでは文書化されませんでした。(この設定は関係ないのでチェックいれなくて良いです。) いろいろ模索していると画像内の文章をテキスト化

                              Googleドライブで、画像やPDFの文字をテキストにするOCRにかける方法 | 経験知
                            • AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB

                              光学式文字認識(OCR)システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 中国の巨大テック企業BaiduのYuning Duらは今回新たに、超軽量のOCRシステムである「PP-OCR」を提案しています。

                                AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB
                              • 誰でも手軽にNTTドコモのサービスのような機能を持つアプリが作れる ~顔検出APIでモザイクカメラを作ろう

                                はじめに 第3回目の本稿は、「docomo Developer support」で公開予定となっている、PUX社の技術を用いた顔・オブジェクト認識APIを使って、顔がモザイクになって写るモザイクカメラアプリを作ってみます。「docomo Developer support」では、このAPIのように、NTTドコモ以外が開発したAPIも公開されており、今後もさまざまなAPIが増える予定になっています(本稿は、2015年1月29日時点の最新情報に基づいております)。 対象読者 JavaとEclipseを用いたAndroidアプリの開発で、基本的な知識がある方を対象とします。 顔・オブジェクト認識API 顔・オブジェクト認識とは、写真や動画などの画像から、特定の人物やもの(オブジェクト)を認識する技術です。最初に、どのような機能があるかを紹介しておきます。 提供されるAPIの概要 提供されるAPI

                                  誰でも手軽にNTTドコモのサービスのような機能を持つアプリが作れる ~顔検出APIでモザイクカメラを作ろう
                                • 「写り込み」はどこまでOK? 文化庁、改正著作権法の新規定を解説

                                  写真やビデオ撮影の際に背景に著作物が写り込んだ場合、著作権侵害に当たらないとする規定などを盛り込んだ改正著作権法の解説ページを文化庁が公開。 文化庁はこのほど、6月27日に公布された改正著作権法の内容を解説するページを公開した。改正著作権法では、写真やビデオ撮影の際に背景に著作物が写り込んだ場合、著作権侵害に当たらないとする規定などを盛り込んでおり、同ページでは、具体例を挙げて解説している。 著作権侵害に当たらない例として、写真撮影時、意図した被写体だけでなく、背景に小さくポスターや絵画が写り込んだ場合や、街中で流れていた音楽がたまたま録り込まれた映像を、放送やインターネット送信する場合などを挙げている。 改正著作権法では、録画機器などの技術開発の際、映画などの著作物を録画する行為や、クラウドサービスのサーバ処理速度を高めるため、データを大量複製する行為も著作権侵害に問われないと規定。例え

                                    「写り込み」はどこまでOK? 文化庁、改正著作権法の新規定を解説
                                  • Googleレンズ、紙のテキストをパソコンにコピペ可能に |男子ハック

                                    Googleは5月7日、「Google レンズ」に紙のテキストを撮影することで、簡単にパソコンへコピーする新機能を追加したと発表しました。新たに撮影したテキストの読み上げ機能も追加。Androidは「Googleレンズ」アプリ、iPhoneは「Googleアプリ」から利用できます。 Googleレンズ新機能は「スマホで撮影したテキストをPCにコピー」「Googleレンズ」で撮影した紙のテキストをPCにコピーGoogleレンズに、「紙のテキストをパソコンにコピーする」機能が追加されました。 これまでもGoogleレンズでは、スマートフォンで撮影した手書きのメモや書類のテキストを読み取ることは出来ましたが、アップデートにより、読み取ったテキストをパソコンに共有、パソコンでコピー&ペーストできるようになりました。 パソコンにコピーするには、パソコン側でChrome(最新版)を使用し、スマートフォ

                                      Googleレンズ、紙のテキストをパソコンにコピペ可能に |男子ハック
                                    • 世界をあるがままに見るということ | isologue

                                      内田樹さんの記事「ネット上の発言の劣化について」を拝読しました。 現在のネットはJUNETの頃のように学者の方々などだけが利用しているわけではないので、その当時に比べて平均的なテキストのクオリティが劣化したかといえば、その通りだとは思います。 しかし私は、この現象は「劣化」ではなく、ツイッターをはじめとするソーシャルメディアなどで、「世界のあるがままの実態」が見えて来ているということではないかと考えています。 例えれば、今まで「きれいだなー」と思って見ていた花壇の石を裏返してみたら、ちっちゃな虫達がゾワワワワと存在した、みたいな。さらに脇のドブの水を顕微鏡で見てみると、見た事もないような微生物がたくさんいました、みたいな。 そういう、ちっちゃな虫や微生物は、観察することで急に発生したわけではなく、今までもちゃんと存在していたわけです。それと同様に、ネットでの妬みやひがみなどを含んだネガティ

                                        世界をあるがままに見るということ | isologue
                                      • JavaScriptでCAPTCHA破り·Megaupload auto-fill captcha MOONGIFT

                                        汎用的なものではないが、技術的には非常に興味深い代物だ。Webサイトではロボットによるクローリングを防止するためにCAPTCHAと呼ばれる仕組みを導入していることがよくある。ぐにゃぐにゃな文字で、人であれば読めるがコンピュータには読めないであろう文字を表示して人かロボットかを判別するのだ。 上に表示されている画像を解析して文字として表示するデモ だがただ文字を画像化したくらいではOCRのような仕組みを使って読まれる可能性がある。それを示したのがMegaupload auto-fill captchaだ。 今回紹介するフリーウェアはMegaupload auto-fill captcha、MegauploadのCAPTCHAを破るGreasemonkeyだ。ソースコードは開示されているがライセンスは明記されていなかったのでご注意いただきたい。 Megaupload auto-fill cap

                                        • PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                          こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?

                                            PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                          • Google Keep の OCR機能が超便利*画像の文字を一瞬でテキストに変えてくれる機能 - ひとりごとブログ

                                            こんにちは、ふなさんです。 普段、勉強やブログの内容をまとめるためにGoogle keepを使っているのですが、OCR機能があることを今更ですが知りました。 OCR機能とは、簡単に言うと画像の中の文字データを読み取ってテキスト化するものです。 私は勉強するときに手書きメモを取ることがありますが、後からまとめるときに手で入力するのは時間がかかります。 OCR機能があると、一瞬で文字データに変えてくれるので、手入力する手間が省けてとても便利です✨ chrome.google.com ①Google Keep でOCR機能を使う手順 Google Keep でOCR機能を使うための手順は以下の通りです。 PC版 ①Google Keep のメモに画像を追加する ②メモの「その他のアクション」をクリック ③「画像のテキストを抽出」をクリック スマホ版 ①Google Keep のメモに画像を追加す

                                              Google Keep の OCR機能が超便利*画像の文字を一瞬でテキストに変えてくれる機能 - ひとりごとブログ
                                            • 名刺管理のSansan、「ほぼ手作業」だったデータ入力はどう進化した? CTOが語った軌跡

                                              名刺管理のSansan、「ほぼ手作業」だったデータ入力はどう進化した? CTOが語った軌跡(1/2 ページ) 「本当はテクノロジーに頼りたかったが、求める水準に技術が追い付かない場合は、勇気を出して他の手段を選ぶべきだと判断した」――。Sansanの藤倉成太CTO(最高技術責任者)は、アマゾン ウェブ サービス ジャパンの年次カンファレンス「AWS Summit Tokyo 2019」のセッションでこう明かした。 Sansanは2007年創業。クラウド型の名刺管理サービス「Sansan」(法人向け)と「Eight」(個人向け)を提供している。いずれもスキャナーかスマートフォンで名刺を読み取ると、氏名や連絡先、部署などのデータをクラウド上に自動で蓄積する仕組みだ。社名・個人名で検索すると名刺情報を表示できる他、メッセージ機能なども搭載し、ビジネスSNSとしても活用できる。 同社は現在、名刺管

                                                名刺管理のSansan、「ほぼ手作業」だったデータ入力はどう進化した? CTOが語った軌跡
                                              • JavaScriptで自動文字認識! Microsoftの無料OCRライブラリーを使おう(後編)

                                                「JavaScriptで自動文字認識」プログラムについての解説の前編では、JavaScriptを使って、画像に書かれている文字をテキストで抽出するプログラムを作りました。 前編で簡単なテストプログラムを作るところまで進めましたが、今回は、複数の画像から連続で文字認識をして、テキストファイルに保存するプログラムを作ってみましょう。Webサイトのスクリーンキャプチャーや、スキャンした画像などをテキストとして保存するのに便利なプログラムです。 MicrosoftのOCRライブラリー「MODI」について 今回解説するプログラムは、Windows専用です。JavaScriptから手軽に画像文字認識を行うために、Microsoftが提供する「MODI」のOCR機能を利用します。このライブラリーのために、無料でダウンロード可能な「SharePoint Designer 2007」をインストールする必要が

                                                  JavaScriptで自動文字認識! Microsoftの無料OCRライブラリーを使おう(後編)
                                                • Kotaku - The Gamer's Guide

                                                  One of the original appeals of the Overwatch League’s formula was the idea of teams traveling around the world to play in each others’ home cities, surrounded by whooping, hollering, body-paint-covered hometown crowds. But that didn’t happen during season one, and reports afterward alleged that it wouldn’t be a thing…

                                                    Kotaku - The Gamer's Guide
                                                  • Gyazo Ninja Account

                                                    When you upgrade to Gyazo Pro you can find all your screenshots and videos everywhere you go. You also get easy editing and longer video recording along with AI features like text-in-image scanning and generated alt text descriptions.

                                                      Gyazo Ninja Account
                                                    • 自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア

                                                      収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coqui https://coqui.ai/ Coquiの創設者たちはもともとFirefoxやThunderbirdの開発で知られるMozillaに在籍していました。創設者たちは音声技術が大企業によって独占され、オープンソースで提供されなくなるかもしれないと考え、独立して企業を立ち上げ、オープンソースの音声認識エンジンを構築したとのこと。 CoquiのSTTモデル「Coqui STT」のリポジトリはGitHubにホストされています。Coqui SSTの特徴は、あらかじめ音声ライブラリが用意されているのではなく、あらかじめ

                                                        自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア
                                                      • 河合楽器、PDFの楽譜を楽譜として認識し、自動演奏するiPadアプリ

                                                        • Python&Plotlyを使って、OCR結果を画像上でインタラクティブに可視化する

                                                          概要 OCRを使った文字読み取りの開発をしていると、読み取られたテキストと画像と見比べて結果の確認をすることがよくあります。読み取られたこの文字は画像のどこから出てきたのかとか、単語の区切りが不自然なときになぜそうなったのかとかといった確認の際には、テキストとその座標から画像中の該当箇所を見つける必要があり、人間が目視で行うにはなかなか大変な作業です。物体認識などのタスクでは、画像上に四角形のバウンディングボックスを物体名のラベルとともに描写して可視化していますが、OCRの読み取りの場合は文字が画像上で密に配置されていたりと、画像上に直接描写するには情報量が過多になってしまいます。なるべくインタラクティブに操作出来る形で情報を表示し、必要な部分だけを確認できるようにしたい場合が多いです。 この記事では、OCR読み取りの結果を画像上に描写して、インタラクティブに結果を確認する方法を紹介します

                                                            Python&Plotlyを使って、OCR結果を画像上でインタラクティブに可視化する
                                                          • 「ScanSnap」に新モデル、3万円以下でPDF自動タグ付け機能も

                                                            PFUは、ドキュメントスキャナ「ScanSnap」シリーズの新製品として、書類の自動PDF化機能などを強化した「S1300」を発表した。11月21日発売で、直販サイト「PFUダイレクト」での価格は2万7800円。ドキュメント管理ソフト「楽2ライブラリ パーソナル V5.0」のセットモデルも用意し、こちらは3万2800円で販売する。 1台でWindowsとMacの両OSに対応し、Windows 2000/XP/Vista/7、Mac OS X 10.4/10.5/10.6以降で使用できる。 S1300は、3万円を切る価格でエントリーモデルの位置付けながら、上位モデルの「S1500」と同等のPDF作成機能を搭載しているのが特徴。読みとった画像中の単語や文章をOCR処理し、PDFのキーワード情報へ追加する「インテリジェント・インデックス機能」や、PDFのキーワード情報を基に保存先を自動的に仕分け

                                                              「ScanSnap」に新モデル、3万円以下でPDF自動タグ付け機能も
                                                            • 富士通、GPUを活用し人間の脳を模した人工知能型手書き文字認識技術を開発

                                                              • 窓の杜 - 【NEWS】Google製エンジンを搭載したフリーの欧文OCRソフト「Softi FreeOCR」v1.5

                                                                Google製エンジンを搭載したフリーのOCRソフト「Softi FreeOCR」v1.5が、21日に公開された。Windowsに対応するフリーソフトで、編集部にてWindows XP/Vistaでの動作を確認した。現在、作者のホームページからダウンロードできる。本ソフトは英語のほか、フランス語、イタリア語、オランダ語、スペイン語、ドイツ語の認識に対応しており、英語以外の言語を利用する場合は下記URLにあるGoogleのWebサイトから、あらかじめ言語ファイルをダウンロードしておく必要がある。なお現在、日本語の読み取りには対応していない。 「Softi FreeOCR」は、スキャナーやJPEGなどの画像ファイルから読み取った文字情報を、テキスト文字列に変換してファイル保存できるOCRソフト。OCRエンジンには、Googleが昨年オープンソースとして公開した「Tesseract」を搭載してい

                                                                • Engadget | Technology News & Reviews

                                                                  Parrots in captivity seem to enjoy video-chatting with their friends on Messenger

                                                                    Engadget | Technology News & Reviews
                                                                  • Googleドキュメントが日本語OCRに対応したというので、Evernoteと比較してみたよ - コンピュータクワガタ

                                                                    Googleドキュメントが日本語OCRに対応した(http://www.dekipaso.com/service/google-docs-ocr-japanese.html)というのでEvernoteと比較してみました。 まず、比較する対象として手書き文字 と、 Wordの正楷書体で書いた文字を用意しました。 これらをGoogleドキュメントにドラッグアンドドロップでアップロードします。アップロード時にOCRするかと聞いてくるのでOCRします。 結果ですがまず手書きのほうです。 さすがに乱雑すぎるのでしょう。全く解析できていません。 続いてWordのほうですが、これはきちんと読めています。素晴らしです。 Evernoteと比較するつもりはなかったのですが、@kawanamioがやれというのでやってみました。 まず、手書きのほうです。実際にどのようにOCRされたかを知る方法がわからなかったの

                                                                      Googleドキュメントが日本語OCRに対応したというので、Evernoteと比較してみたよ - コンピュータクワガタ
                                                                    • 「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics

                                                                      日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があります。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが重要な課題となっています。 そこでこの社会課題の解決にAI(人工知能)を活用する方法を探るため、この7月から10月にかけて、世界最大規模の機械学習コンペプラットフォームである「Kaggle(カグル)」で、「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題する全世界的なコンペを開催します。コンペを通して画期的なくずし字認識手法の開発が進むだけでなく、くずし字データセット

                                                                        「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics
                                                                      • 文字認識ライブラリ okrabyte を使ってS3にPUTされた画像をAWS Lambdaで文字認識する - from scratch

                                                                        このエントリはAWS Lambda Advent Calendar 2014 - Qiitaの(本当は9日目の)記事です。 (ちょっとAWS Lambdaのアカウント取得に手間取ってしまって遅刻してしまいました。。すいません。。) AWS Lambda とは AWS LambdaはAmazonが作った新サービスであり、S3の変更やDynamoDBの変更をフックしてNode.jsの関数を実行するという仕組みになっています。これを使うと、例えばデータが変更された後にPush Notificationを出したり、S3にアップロードされた画像のサムネイル画像を作成したりといったことが可能になります。 今回はこのAWS Lambdaを使ってS3でPUTされた画像から文字認識をしてみようという試みです。文字認識した結果をDynamoDBとかに置いて検索に利用すれば、画像内に書かれた文字で検索できるよう

                                                                        • メモの作成やタスク管理、共同作業を効率化!Evernoteから乗り換えるべきメモアプリ8選 | ライフハッカー・ジャパン

                                                                          4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

                                                                            メモの作成やタスク管理、共同作業を効率化!Evernoteから乗り換えるべきメモアプリ8選 | ライフハッカー・ジャパン
                                                                          • まちみのな::C#で文字認識を行う

                                                                            Microsoft Office をインストールすると、実は OCR ソフトがついてきます。C# からの利用も簡単です。下記のコードを、Visual C# Express 2005 または 2008 で作成し、参照設定に、 Microsoft Office Document Imaging 11.0 Type Library (MDIVWCTL.DLL) を追加してビルドしてください。 [:ボックス1:] ソースコードのダウンロード (Visual C# Express 2008 用) v1.0 (2008/07/21) using System; using System.Text; /// /// OCR with MicrosoftR Office By Martin Welker (CodeProject) /// に基づく Office 2003 に依存したOCR処理。 /// 

                                                                            • PDFをWord・画像・テキスト・HTMLファイルに変換(OCR対応)できるソフト「UniPDF」 | フリーソフトラボ.com

                                                                              UniPDF 「UniPDF」は、PDFファイルを画像ファイル・Wordファイル・テキストファイル・HTMLファイルに変換するソフト。Wordファイルは「.ref」「.doc」、画像ファイルは「.bmp」「.jpg」「.tif」「.png」「.gif」「.pcx」「.tga」にそれぞれ変換形式を指定することができます。 Wordファイルおよび画像ファイルに変換する場合は、特定のページや範囲を指定して抽出することが可能。両面スキャナーでPDFファイルとして取り込んだ書類や電子書籍などもOCR処理されている場合は、Wordファイルとして出力する際、変換後のファイルにOCRのテキストを反映してくれます。 使い方は簡単で、ドラッグ&ドロップでPDFファイルを追加してファイル形式を指定し「変換」ボタンをクリックするだけ。複数ページあるPDFを画像ファイルにばらしたり、資料をMicrosoft Wor

                                                                                PDFをWord・画像・テキスト・HTMLファイルに変換(OCR対応)できるソフト「UniPDF」 | フリーソフトラボ.com
                                                                              • 「iPhoneのメモ」はもはや多機能なノートアプリだ

                                                                                「メモ」というネーミングもあり、簡易的な機能を想像してしまうiPhoneのメモアプリだが、その実態は多機能なノートアプリに近い。WordやPagesのような文章レイアウトまではできないものの、画像を張り付けたり、表組を挿入したりと、短い文章を書くだけにとどまらない機能を備えている。メモ本来の意味である覚え書きを超えて、あたかもノートを作成するかのような使い方が可能だ。メモアプリはiPhoneの言語を英語にすると「Notes」という名称になるが、搭載されている機能や用途は「Notebook」に近い印象も受ける。 そんなiPhoneのメモアプリが、iOS16でより整理しやすく進化している。新機能として注目したいのが、「クイックメモ」。この機能を使うと、ブラウジングなどをしている際に、素早くメモを残せるようになる。特定の条件に合ったメモを自動でフォルダに分ける「スマートフォルダ」も、設定項目が増

                                                                                  「iPhoneのメモ」はもはや多機能なノートアプリだ
                                                                                • Google Docs、画像から日本語を抽出するOCR機能搭載 | ネット | マイコミジャーナル

                                                                                  Create and edit web-based documents, spreadsheets, and presentations. Googleは2月28日(米国時間)、Google DocsのOCR機能に新しく29のサポート言語を追加したことを発表した。この結果、Google DocsがサポートするOCR向け言語は34となる。今回の機能追加で日本語もサポートされるようになっており、日本語を含んだ画像やPDFをアップロードして、日本語テキストを抽出することができる。 OCRによるテキスト抽出の機能を利用するには、画像をアップロードする段階で「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」にチェックを入れて、言語として「日本語」を選択すればよい。画像とともに抽出されたテキストも表示されるようになる。 マイコミジャーナルに掲載された記事の画像 Go