並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 1600件

新着順 人気順

OCRの検索結果161 - 200 件 / 1600件

  • 米グーグル「書籍全文検索」 日本の絶版本も対象になる可能性

    米グーグル社が進めている書籍検索サービスが、波紋を広げている。「絶版だが著作権はある」という書籍のデジタル化をめぐる訴訟が「和解」という形で決着しそうで、この影響が日本の本にも及ぶというのだ。米国内に条件を満たした日本の絶版本があれば、すべて内容が世界中に公開されることになる。日本の業界からの反発は必至だが、専門家からは「利益が適切に配分されるのであれば、拒否すべきではない。紙で『死蔵』するよりはましだ」と、著作権側の立ち位置の見直しを迫る声もあがっている。 「絶版になったが著作権は存在している」書籍のデジタル化が進む 米グーグルは2004年、書籍の全文検索が可能になるサービス「グーグル・ブック・サーチ」を立ち上げ、現在は書籍100万冊以上の内容がウェブ上で検索できる。当然、この仕組みに、著作権者側は反発。米作家協会や米出版協会(AAP)が05年9月から10月にかけて、著作権侵害を訴え、グ

      米グーグル「書籍全文検索」 日本の絶版本も対象になる可能性
    • 自炊した電子書籍(PDF)を iPad でサクサク表示する方法(サンプル動画あり) - おいちゃんと呼ばれています

      以前、このような(↓)自炊(=本を自前で電子化)PDF に関するエントリーを書いてみたのですが... -電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww -iPadに本を電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 | nanapi[ナナピ] たしかに PDF のファイルサイズは小さくなって、その分多くの本を iPad で持ち歩けるようにはなりましたが、 なにせ 表示が遅い。遅すぎる(↓) で、これは「どげんかせんといかん」と思い、あれやこれや試した結果、 Adobe Acrobat 9 の「ClearScan」機能で OCR テキスト認識すれば OK << という解決策を見つけましたので、報告します。 *1. テキストが多くて、版の大きい本の表示が遅い 表示が遅いといっても、すべての本の表示が遅いのではなく、

        自炊した電子書籍(PDF)を iPad でサクサク表示する方法(サンプル動画あり) - おいちゃんと呼ばれています
      • tesseract-ocr - Google Code

        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

          tesseract-ocr - Google Code
        • 画像からテキストを抽出、ファイル名を一括変更…Windowsを快適にする公式無料ツール「PowerToys」おすすめ機能7選 | 文春オンライン

          「PowerToys」という無料ツールをご存知でしょうか。Windowsをさらに使いやすくする十数個の機能をまとめた、Microsoftの公式ツールです。カユイところに手が届く数々の機能はいちど使うと手が放せなくなるほどで、どうしてこれがWindowsに最初から組み込まれていないのだろうと首をひねってしまうほどです。 そんな「PowerToys」は、今年9月に入って登場した最新版の「0.62.0」で、これまでなかった新機能がいくつか追加され、より充実したツールへと生まれ変わりました。 今回は最新の「0.62.0」で追加された機能も含め、筆者が「これは特に便利」と感じたPowerToysの便利機能を厳選して紹介します。ピンと来る機能があれば、ぜひこの機会にインストールして試してみてください。ダウンロードはMicrosoftストア、もしくはこちらから行えます。

            画像からテキストを抽出、ファイル名を一括変更…Windowsを快適にする公式無料ツール「PowerToys」おすすめ機能7選 | 文春オンライン
          • HugeDomains.com

            Captcha security check mvpen is for sale Please prove you're not a robot View Price

            • Genius Scan: スキャンアプリの価格破壊や!名刺、領収書、ホワイトボードなどをスキャンだ!無料。1910 | AppBank

              Genius Scan: スキャンアプリの価格破壊や!名刺、領収書、ホワイトボードなどをスキャンだ!無料。1910 このクオリティで無料とは・・・。スキャンアプリの価格破壊や!!! Genius Scanの3ポイント紹介 ・iPhoneが小さなスキャン装置に ・撮影したデータはすぐにJPGとPDFで送信 ・無料! このアプリは、iPhoneを簡単なスキャン装置のように使えるアプリGenius Scanです。 書類やメモの写真を撮り、スキャンしたい範囲を選択します。すると自動的に変換が始まり、JPGもしくはPDFでそのデータを保存・送信できるようになります。 早速ご紹介していきます! 起動したら、「From camera」をタップして写真を撮りましょう! (写真があるなら「From library」をタップしましょう!) 名刺を撮ってみました!ここで、スキャンしたい範囲を選択しましょう。横か

              • Microsoft、次期「Excel for iOS」で撮影した写真内の表を直接テーブル化してくれる機能を追加。

                Microsoftが次期「Excel for iOS」で撮影した写真内の表を直接Excelのテーブル化してくれる機能を追加すると発表しています。詳細は以下から。 MicrosoftのOffice for macOS/iOSチームのプロダクトマネージャーAkshay Bakshiさんによると、同社は2019年02月のアップデートでExcel for Androidに「Insert Data from Picture」という撮影した写真内の表を自動認識し、直接Excelのテーブルに転写してくれる機能を追加しロールアウトを開始しており、iOSチームも現在この機能を実装中だと発表しています。 Add data to Excel directly from a photo — Using the Excel app, you can take a picture of a printed data

                  Microsoft、次期「Excel for iOS」で撮影した写真内の表を直接テーブル化してくれる機能を追加。
                • 9800円のデジタルペンに脱帽! 文字認識率は想像以上で実用性十分!! - 日経トレンディネット

                  「戸田覚の1万円研究所」では実売価格1万円以下の周辺機器やサプライ品などを自腹で購入し、独自の目線で検証していく。第65回は手書きのメモをそのままデジタルデータにできるデジタルペン。価格と使い勝手の良さで戸田氏もおすすめだ。 専用紙不要で手書き文字をデジタルデータとして取り込めるデジタルペン。A4サイズ50ページ分以上を保存できる。取り込んだデータは付属のOCRソフトでリッチテキストにも変換でき、そのままメール送信することも可能だ。カラーバリエーションは3種類。収納キャリーケース付き。製品情報はこちら 当研究所始まって以来、最もエキサイティングな商品をご紹介しよう。 手書きのメモをパソコンに取り込めるデジタルペン「MVPen」が1万円以下で買えるようになったのだ! そもそもこの製品は夏頃に登場していたのだが、実売価格が当研究所の予算に合わなかった。それが、ここへきて1万円以下で買えるケース

                    9800円のデジタルペンに脱帽! 文字認識率は想像以上で実用性十分!! - 日経トレンディネット
                  • YouTube - Introducing Word Lens

                    NEW: Word lens has now been integrated to the Google Translate app and is not available anymore as a standalone app. Download the Google Translate app: - Android: https://play.google.com/store/apps/details?id=com.google.android.apps.translate - iOS: https://itunes.apple.com/us/app/google-translate/id414706506?mt=8

                      YouTube - Introducing Word Lens
                    • Vision AI: Image & Visual AI Tools

                      Try Gemini 1.5 models, our newest multimodal models in Vertex AI, and see what you can build with a 1M token context window Access advanced vision models via APIs to automate vision tasks, streamline analysis, and unlock actionable insights. Or build custom apps with no-code model training and low cost in a managed environment. New customers get up to $300 in free credits to try Vision AI and othe

                        Vision AI: Image & Visual AI Tools
                      • TechCrunch

                        When I reviewed the Espresso Display last year, I concluded that it would be a great addition to a mobile office setup for workers who needed additional screen real estate without taking up too much s Braid, a four-year-old startup that aimed to make shared wallets more mainstream among consumers, has shut down. Founded in January 2019 by Amanda Peyton and Todd Berman (who left in 2020), San Franc

                          TechCrunch
                        • GPT-4oを使って2Dの図面から3DのCADモデルを作る

                          はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

                            GPT-4oを使って2Dの図面から3DのCADモデルを作る
                          • Googleが「CAPTCHA」を改良、リスク分析により人間と機械を区別

                            • 崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」

                              刀箱師 | 中村圭佑 | 展示ケース作家 | 刀とくらす。 @katana_case_shi 「わけのほる 麓の道はおほけれど おなじ高ねの 月をこそみれ」 どうやら「わけのほる」という一休宗純の和歌のようで、以下のサイトを見ると解説がありました。 当時この鐔を付けて戦った武士はこの和歌にどのような想いを重ねたのだろうか。 575.jpn.org/article/174793… pic.twitter.com/dSIJbpS4OB 2022-12-22 23:40:23

                                崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」
                              • ScanSnap から直接 Evernote へ読み込み

                                ペーパーレス・オフィスを目指す人の必需品といっていい ScanSnap ですが、スキャンしたファイルが散らばって今度はハードディスクに 20090511180045.pdf といった ファイルが散在していませんか? そういえば年度末に ScanSnap S1500 を買って、それを Evernote と連携させる設定をしていませんでしたので、Evernote Blog のこちらの記事を参考にやってみました。 Windows だったらシステムトレイから、Mac OS X なら Dock から Evernote ScanSnap の環境設定を呼び出します。 アプリ選択のタブから、「追加と削除」を選び、Evernote を追加 おわり たったこれだけです。設定後は、スキャンボタンを押すだけで結果が Evernote に自動で読み込まれるようになりますので、もう数字だらけのファイルが散らばったりし

                                  ScanSnap から直接 Evernote へ読み込み
                                • 手書きひらがなの認識で99.78%の精度をディープラーニングで - Qiita

                                  手書きひらがなの認識、教科書通りの畳み込みニューラルネットワーク(ディープラーニング)で、99.78%の精度が出ました。教科書通りである事が(独自性がない事が)逆に読む方・書く方にメリットがありそうなので、Qiitaで記事にします。 ソースコード ソースコードは https://github.com/yukoba/CnnJapaneseCharacter です。 いきさつ いきさつは、友人と手書きひらがなの認識の雑談をFacebookでしていて、ググったら、この2つが見つかりました。 「Tensorflowを2ヶ月触ったので"手書きひらがな"の識別95.04%で畳み込みニューラルネットワークをわかりやすく解説」 http://qiita.com/tawago/items/931bea2ff6d56e32d693 スタンフォード大学の学生さんのレポート「Recognizing Handwri

                                    手書きひらがなの認識で99.78%の精度をディープラーニングで - Qiita
                                  • https://docs.google.com/presentation/d/1LHplQ8nqNJNxaqY7DL4eM329jZKfO-E15XHoadYeLfE/mobilepresent?slide=id.g240ca7fffa_0_15369

                                      https://docs.google.com/presentation/d/1LHplQ8nqNJNxaqY7DL4eM329jZKfO-E15XHoadYeLfE/mobilepresent?slide=id.g240ca7fffa_0_15369
                                    • 宿題は人工知能にやらせる今どきの小学生。中国政府は宿題をAIにやらせることを禁止 - 中華IT最新事情

                                      中国共産党中央弁公庁と国務院は、「義務教育段階の生徒の家庭学習と校外課程の負担のいっそうの軽減についての意見」を公開した。内容は、「拍照捜題」を禁止するものだ。これを受けて、多くの学習アプリが拍題捜答機能を停止させていると青少年教育新聞が報じた。 宿題は人工知能にお任せの今どきの小学生たち 拍照捜題とは、学習アプリの人気機能で、宿題をするときに便利な機能。プリントなどの問題を、アプリ経由でスマホで撮影すると、その内容をAIが解析し、解法と答えを表示してくれるというもの。同じ問題が見つからない場合は、類似の問題の解法と答えを表示してくれる。 本来は、自分で解けない問題を調べるためのものだが、学習アプリの競争が激しくなる中で、解答を直接表示するようになり、多くの学生が、学習アプリが表示する解法と答えを丸写しして提出することが増え、教師や父兄の間で問題になっていた。 ▲学習アプリ「作業帮」の拍照

                                        宿題は人工知能にやらせる今どきの小学生。中国政府は宿題をAIにやらせることを禁止 - 中華IT最新事情
                                      • Windows 10の標準機能だけで画像からテキストを抽出する方法

                                        画像ファイルからテキストを抽出したい場合、何らかのOCR(光学式文字認識)ソフトウェアを利用するのが一般的だ。しかし、BetaNewsは1月6日(米国時間)、「Windows 10 has a secret way to grab text from images」において、特定のソフトウェアを使わずに、Windows 10に付属する標準機能だけでテキストの抽出を行う方法を伝えた。なお、この方法は現在のところ英語のテキストにしか対応しておらず、残念ながら日本語は読み取ることができない。 Windowsの標準機能といっても、何らかのORCツールが標準でインストールされているというわけではない。したがって、スタートメニューのアプリケーション一覧を探しても該当する機能は見つからない。Betanewsで紹介されているのは、Windowsの検索ユーティリティとスクリーンショットを取得するための「切り

                                          Windows 10の標準機能だけで画像からテキストを抽出する方法
                                        • 家計簿アプリ「Zaim」にレシート自動読み取り機能

                                          Zaimは4月19日、オンライン家計簿サービス「Zaim」のiOS版に、カメラで撮影したレシートを自動的に認識する新機能を追加した。 iPhone/iPadのカメラからレシートを撮影すると、合計金額や購入品目、日付などを自動的に認識して入力する。店舗名や、カテゴリ・ジャンルの推定なども行う機能を備えた。 レシート読み取りは、平均認識率が96%というアイエスピーのレシート解析システムを採用。店舗名やカテゴリ・ジャンルの推定などは独自に搭載した。 今後PC版・Android版にも追加するほか、読み取り結果とユーザーの入力内容を自動学習させていくことで、精度の改善につなげていく。 関連記事 クックパッド、家計簿アプリの「Zaim」に4200万円出資 家計簿アプリのZaimにクックパッドが4200万円出資。Zaimは今後、Webブラウザ版などを開発し、マネー系の総合サービスを目指す。 クラウド家計

                                            家計簿アプリ「Zaim」にレシート自動読み取り機能
                                          • Free Online OCR - Image to text and PDF to Doc converter

                                            1. Upload Image Upload Image or PDF document for conversion. You can upload any type of input images or documents, such as PDF, Tiff, PNG, BMP and other. One limitation for the input document is that the file size is no more than 15 MB 2. Language and output You should select appropriated recognition language for most accuracy conversion image to text. And also, you may choose output format (MS Do

                                              Free Online OCR - Image to text and PDF to Doc converter
                                            • 未来型デジタルペン「MVPen」を試す

                                              イスラエルで設計・開発された「MVPen」。ボールペンを兼ねたデジタルペンと本体ユニットの2ピース構成で、製品パッケージには付属ソフトのCD-ROMやUSBケーブルのほかにリフィル用ボールペンインクも入っている。価格は1万2600円 「+D Select」をご存じだろうか。 名称から想像できる通り、+D編集部とパートナーが持ち前の“センスと度胸”で選んだモノばかりを販売しているセレクトショップ(通販サイト)だ。そのため、等身大マネキンとか、全長2.6メートルのキングギドラとか、マグロとか、ITとは縁のないアイテムも並ぶ(ちなみにマグロは完売御礼)。 編集部にもEC担当者がいて、ときどき“そっち方面”から流れてきた製品を持ち込んではいじっていたりする。もちろん、普段は横目で見ながら素知らぬふりで通り過ぎるのだが、今回は不覚にも足を止めてしまった。 イスラエルからやってきた未来型デジタルペン「

                                                未来型デジタルペン「MVPen」を試す
                                              • PC診断士

                                                エーアイソフト製品アップデータダウンロードおよびFAQ掲載終了(閉鎖)のお知らせ 「サポートサービスご利用規定」に基づきまして、エーアイソフト製品のアップデータダウンロードおよびFAQの掲載を2020年10月30日(金)をもちまして終了(閉鎖)いたしました。

                                                • Microsoft、手書きのUIスケッチをHTMLに変換する「Sketch2Code」を発表

                                                  Microsoft、手書きのUIスケッチをHTMLに変換する「Sketch2Code」を発表:AIで手書きの図形と文字を認識 Microsoftは、手書きでスケッチしたUI画面をHTMLコードに自動変換するWebベースソリューション「Sketch2Code」を発表した。 Microsoftは2018年8月30日(米国時間)、ホワイトボードなどに手書きでスケッチしたユーザーインタフェース(UI)画面を、AI(人工知能)を利用して、HTMLコードに変換するWebベースソリューション「Sketch2Code」を発表した。 Microsoftによれば、UIのデザインプロセスには無駄が多いという。通常は、まずアイデアレベルのスケッチをホワイトボードに描き、数人で検討してから写真に撮影し、HTMLコードを書き下す。これでは手間ばかりかかり、すぐにアイデアを形にできない。 画像認識技術とAIを組み合わせ

                                                    Microsoft、手書きのUIスケッチをHTMLに変換する「Sketch2Code」を発表
                                                  • Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供/“Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応

                                                      Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供/“Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応
                                                    • ScanSnap iX500とEvernoteで名刺管理するメリット3つとその具体的手順

                                                      ① 取り込みが早い。1枚1秒程度S1500からiX500になり、より取り込みのスピードがアップ。 後ほど動画をご紹介しますが、だいたい1枚1秒ほどで取り込むことができます。 ScanSnap iX500はEvernoteと連携しているので、取り込んだものを直接Evernoteに送ることも可能。 名刺交換して帰ってきたら、ちょこっと設定(後述)してボタンを押せばあっというまに電子化完了、名刺はしまっておくなり捨ててしまってもほぼ問題なしです。 ② 検索や整理が簡単ScanSnapでも、EvernoteでもOCR(文字認識)をかけることが可能。 つまり、名前や会社名、住所などを使って、パソコン内検索でもEvernote内検索でも探せるということ。 さらに、Evernoteのノートブックやタグ+ドラッグ&ドロップで、紙の名刺を五十音順や会った順や会社別に一生懸命振り分けるよりもずっと少ない手間で

                                                        ScanSnap iX500とEvernoteで名刺管理するメリット3つとその具体的手順
                                                      • CAPTCHA - Wikipedia

                                                        この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2021年3月) 古い情報を更新する必要があります。(2021年3月) 独自研究が含まれているおそれがあります。(2020年5月) 出典検索?: "CAPTCHA" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 初期のCAPTCHAの例。 人間はこれを「HTKEHS」と認識できるが、機械にとっては困難である。 CAPTCHA(キャプチャ)はチャレンジ/レスポンス型テスト(英語版)の一種で、応答者がコンピュータではなく生身の人間であることを確認するために使われる。 ウィキペディアにおいても、ログインしていない状態のユーザ(IPユーザー)が外部リ

                                                        • IBM Developer

                                                          IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

                                                            IBM Developer
                                                          • CamiApp<キャミアップ> - コクヨ ステーショナリー

                                                            【重要なご案内】 CamiAppアプリは2021年12月24日にてダウンロードページへの公開を終了いたします。お手持ちのCamiAppアプリは公開終了後もご利用いただけますが、OSのバージョンアップ等により正常に動作しなくなることがあります。必要なデータは、あらかじめ連携先やアルバムに転送・保存ください。ご了承のほどお願い申し上げます。 詳細はこちら ※IOSの商標は、米国Ciscoの米国およびその他の国のライセンスに基づき使用されています。 ※App StoreはApple Inc.のサービスマークです。 ※Android™、Google、Google Playは、Google Inc.の商標または登録商標です。 ※Windows®は、米国Microsoft Corporationの米国及びその他の国における商標または登録商標です。 ※その他記載された会社名、製品名などは、各社の商標また

                                                            • Convert PDF to Jpeg online

                                                              Online Document Management System Cometdocs is a highly-regarded, free, online document management system that has served over 3 million customer and counting. It began as an online file conversion service in 2009, but now offers many more free services, including document sharing, transfers and storage. Cometdocs aims to provide a complete online solution for all your document management needs. E

                                                              • PythonとWinRT OCRで文字認識 - Qiita

                                                                import cv2 img = cv2.imread('test.jpg') (await winocr.recognize_cv2(img, 'ja')).text pip install jupyterlab jupyter_http_over_ws jupyter serverextension enable --py jupyter_http_over_ws jupyter notebook --NotebookApp.allow_origin='https://colab.research.google.com' --ip=0.0.0.0 --port=8888 --NotebookApp.port_retries=0

                                                                  PythonとWinRT OCRで文字認識 - Qiita
                                                                • Google Drive

                                                                  どこからでもアクセスできます。Google ドライブは、ウェブ上、自宅、職場、外出先など、どこでも利用できます。どこからでも自分のデータにアクセスして、編集、共有できます。5 GB を無料でご利用いただけます。 Google ドライブは次の端末でご利用いただけます:Windows と MaciPhone and iPad (coming soon)Android 搭載端末 安全な場所に ファイルを保管します。災難は思いがけず訪れます。携帯電話が水没したり、ノートパソコンが故障することがあります。ご使用の端末に何があっても、Google ドライブならファイルが安全に保存されています。 ただ保存できるだけでなく、共同編集が可能です。Google ドライブでは単にファイルを保存するだけではなく、あらゆる端末から目的の相手にだけファイルを共有したり、共同編集することができます。 Google ドラ

                                                                  • TechCrunch

                                                                    Last year’s techwide reckoning continues. The tech industry has seen more than 240,000 jobs lost in 2023, a total that’s already 50% higher than last year and growing. Earlier this year, mass work

                                                                      TechCrunch
                                                                    • EvernoteでエロゲのスクリーンショットをOCRして全文検索 - 偏読日記@はてな

                                                                      エロゲ/ギャルゲプレイ中の「画面キャプチャ」のススメ(その2) - 偏読日記@はてな この記事で書いたとおり、俺はPCでプレイするノベルゲーム(エロゲ/ギャルゲ)のプレイ中にスクリーンショットを保存することによりシーンや台詞を保存してあとから見返すのに使っています。ゲームへの没頭を妨げることなくPrintScreenキー一つで気軽に保存できるので、プレイ中の記録を取るのにかなり適した手段だと思っています。 しかし、問題はノベルゲームの文章を記録しているのに保存形式は画像であると言うこと。おかげで特定のシーンを見返そうと思っても一枚ずつ目視して探すほか手段がありません。 ファイルが少ないうちはまだ大丈夫でしょうが、俺の場合2003年からプレイ中画面キャプチャを続けてきた結果としてファイル総数16000超、ファイルサイズ総計4.9GBという恐ろしいことになっていたのです。 エバーノートでの名刺

                                                                        EvernoteでエロゲのスクリーンショットをOCRして全文検索 - 偏読日記@はてな
                                                                      • 原子カ(カタカナのカ)で検索して驚いた

                                                                        しだいに問題点と原因が分かってきました。コメントをする人は書き込む前に、この解説文も含めて最後まで読んでください。まとめでは特に最後の6個が大事です。 パソコンを使ってワードやパワーポイントで作った資料をPFDに変換する時には、編集だけを不可にして、文字コピーを可にしたPDFデータにすればいいのに、日本政府と電力会社が公開しているPDFは意図的に文字コピー不可にしていることが原因です。 続きを読む

                                                                          原子カ(カタカナのカ)で検索して驚いた
                                                                        • Zinnia: 機械学習ベースのポータブルな手書き文字認識エンジン

                                                                          Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 主な特徴 機械学習アルゴリズムSVMによる高い認識精度 ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント

                                                                          • MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介

                                                                            うーん、これは凄い。 OCRという技術はフリーでは殆ど見られない(日本語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。 それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。 今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。 クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。 そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。 さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR

                                                                              MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介
                                                                            • Tesseract.js | Pure Javascript OCR for 100 Languages!

                                                                              Tesseract.js is a pure Javascript port of the popular Tesseract OCR engine. This library supports more than 100 languages, automatic text orientation and script detection, a simple interface for reading paragraph, word, and character bounding boxes. Tesseract.js can run either in a browser and on a server with NodeJS. Check out the Example code and API docs on GitHub.

                                                                              • ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp

                                                                                いまからわかる!ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って⁠⁠、請求書の構造化データを抽出する 先月、OpenAIからFunction calling(関数呼び出し)機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。 今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAIが2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。 外部ツールを呼び出して質問に答えるチャットボットを作成する 自然言語を内部APIの呼び出しやSQLに変換する テキストから構造化データを抽出する たとえば天気予報と血液型

                                                                                  ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp
                                                                                • グーテンベルクの願い、アルダスの夢(山田祥平のRe:config.sys)

                                                                                  ヨハン・グーテンベルクは活版印刷術を実用化し、その数十年後、アルダス・マヌティウスは持ち歩ける本を作った。出先では本や雑誌、新聞を読み、家では音楽を聴きTVを見るぼくらの日常は彼らの仕事に源を持つ。彼らの功績からほぼ500年。いつのまにか、印刷コンテンツより音楽や動画コンテンツの方が持ち出しやすくなってしまってはいないか。でも、10インチのディスプレイは、文庫本のほぼ見開きサイズ。ならば、パソコンで文庫を読んでみよう。そう思って書籍のデジタル化を試みてみた。紙の本と比べていったいどうなのか。 ●スキャンのために本を裁断する インターネットを探せば電子ブックを購入できるサイトはずいぶんたくさんあるように見える。でも、そこに読みたいコンテンツがあるかどうかは別問題だ。やはり、書店に積まれた新刊書の方が、まだまだ魅力があり、本を読むとなると、どうしても、書店に赴いたり、通販サイトを物色して、紙の