並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 313件

新着順 人気順

OCRの検索結果121 - 160 件 / 313件

  • DX Suite |AI-OCR市場シェアNO.1のDX Suite

    企業には申込書や領収書の管理など、アナログで行っている業務がたくさんあります。 DX Suite は、これまで手入力で行っていた帳票のデジタル化を効率的に実現し、企業の課題解決に貢献します。

      DX Suite |AI-OCR市場シェアNO.1のDX Suite
    • 国立国会図書館が保有するデジタル化資料、247万点・2億2300万枚超の全文テキストデータ化に「CLOVA OCR」が採用

      国立国会図書館が保有するデジタル化資料、247万点・2億2300万枚超の全文テキストデータ化に「CLOVA OCR」が採用『ビジョン2021-2025 国立国会図書館のデジタルシフト』の一環として、視覚障がい者や高齢者を含む全ユーザーの利便性向上、アクセスの飛躍的な拡大を目指す LINE株式会社 AIカンパニー(本社:東京都新宿区、カンパニーCEO:砂金 信一郎)は、国立国会図書館(東京都千代田区)が保有する247万点、2億2300万枚を超えるデジタル化資料のOCRテキストデータ化プロジェクトに、CLOVA OCRが採用されましたことを、お知らせいたします。 国立国会図書館では『ビジョン2021-2025 国立国会図書館のデジタルシフト』の一環として、デジタルで全ての国内出版物が読める未来を目指し、来年3月までに247万点のデジタル化資料をテキストデータ化する取り組みが行われています。 『

        国立国会図書館が保有するデジタル化資料、247万点・2億2300万枚超の全文テキストデータ化に「CLOVA OCR」が採用
      • kintoneがLINE CLOVA OCRと連携 請求書やレシートを簡単に電子化

        ジョイゾーは、サイボウズが提供する「kintone」とLINEが提供する「LINE CLOVA」のAI技術を活用した文字認識サービス「CLOVA OCR」とを連携するkintoneプラグイン「CLOVA OCRプラグイン」を2022年6月7日から提供開始しました。 このAIニュースのポイント 「kintone」と「CLOVA OCR」とを連携するkintoneプラグイン「CLOVA OCRプラグイン」を6月7日から提供開始 高度なAI-OCRの技術を使い、kintone上で簡単にレシートや領収書をOCRで読み取ることが可能 画像をアップロードすると、レシート内の店名、金額などの必要事項を読み取り、自動的に登録 株式会社ジョイゾーは、サイボウズ株式会社が提供する「kintone(キントーン)」とLINE株式会社が提供する「LINE CLOVA」のAI技術を活用した文字認識サービス「CLOVA

          kintoneがLINE CLOVA OCRと連携 請求書やレシートを簡単に電子化
        • 印刷された文字のテキスト化(OCR)は、もっぱらLINEとGoogle検索使ってるよ

          情報管理LOGの@yoshinonです。 情報管理LOGのお得意記事の一つにOCR関係の記事があるのですが、ここ最近はどのアプリもかなり精度が高くなってきて、困ることが少なくなってきました。そのため、今までと違い、一番ラクにできるものを求めている自分がいます。 今回は、そんな私が、最近OCRアプリとしてLINEとGoogle検索をメインで使っているよというお話です。 そもそもOCRって何?という方もいらっしゃると思われますので、超簡単に説明すると 印刷されている文字を読み取り、テキスト化する技術 です。 日本語で書くと「光学文字認識」ってなります。 OCRは、Optical character recognitionの略ですね。 詳しくは、このあたりを読んでみてください。 光学文字認識 情報管理LOGでは、たびたびOCRがらみの記事を書いており、1大コンテンツになっています。以下にOCR関

            印刷された文字のテキスト化(OCR)は、もっぱらLINEとGoogle検索使ってるよ
          • AnthropicのClaude 3 OpusのVision機能を日本語OCRとして使ってみる

            今月4日、AnthropicがClaude 3を発表しました。Anthropicの発表している評価結果では、OpenAI GPT-4やGoogleのGemini 1.0 Ultraを上回る高い性能を示しています。私もClaude 3 Sonnetを使って、翻訳やテストケース作成などの作業をいくつかやってもらいましたが、私の体感でもGPT-4と同等かそれを上回る高い性能だと感じました。 最近の生成AIは画像認識系機能を組み込んでおり、Claude 3もVision機能が提供されています。具体的には写真やグラフ、図などを読み込んで処理する用途が想定されているそうです。 私は以前から、「Azure Computer Vision APIの日本語OCR機能を使ってみる」、「Google Cloud Vision APIの日本語OCR機能を使ってみる」、「OpenAIのGPT-4 Turbo wit

              AnthropicのClaude 3 OpusのVision機能を日本語OCRとして使ってみる
            • 【2022年版】Azure/GCP/AWS OCRサービス比較(随時更新) - Qiita

              はじめに 概要 昨年主要なパブリッククラウドであるAzure,GCP,AWSのOCRサービスの比較記事を書きましたが、クラウドの世界は進化が早いですね。 2021年にそれぞれのサービスでアップデートがありましたので、改めて比較してみたいと思います。 以下の前回の比較記事です。 【2021年版】Azure/GCP/AWS OCRサービス比較 実は今回、マイクロソフトから最新のAPIのプライベートプレビュー版を入手しました。 プライベートプレビュー版なのでバージョンアップ内容の詳細は控えますが、日本語手書き文字の認識精度が猛烈に向上しています。 (2022/05/02 追記) 2022年2月にパブリックプレビューに移行しました。 バージョンアップ内容の詳細はこちらをご確認ください。 この記事の想定読者 クラウドが提供するOCR機能に興味のある方 どのクラウドサービスを導入しようか迷われている方

                【2022年版】Azure/GCP/AWS OCRサービス比較(随時更新) - Qiita
              • 【Colab】Vision APIでレシートOCR - Qiita

                はじめに GoogleのVision APIを使用してレシートのOCRをしてみました。 言語はPython、環境はGoogle Colaboratoryを使用しています。 実装 入力画像 OCRする画像を表示してみます。 import cv2 import matplotlib.pyplot as plt %matplotlib inline import matplotlib img = cv2.imread(input_file) # input_fileは画像のパス plt.figure(figsize=[10,10]) plt.axis('off') plt.imshow(img[:,:,::-1])

                  【Colab】Vision APIでレシートOCR - Qiita
                • 【RPA】AI-OCR適用業務選定をする際の注意点 - 精度100%の壁 - Qiita

                  RPA適用業務は半分近くがOCRと絡むともいわれており、帳票を読み取って電子化して自動化をしたいというニーズは多い。RPAソフトウェアの多くもOCR機能を標準で内蔵して、これに応えている。しかし、OCR関連のプロジェクトでPoCを実施する際には「はまりポイント」が存在し、検証段階で頓挫してしまうプロジェクトも結構あるという。筆者もいくつかのプロジェクトを見てきたが、このはまりポイントの事を「精度100%の壁」と仮に呼ぶことにした。OCRプロジェクトがはまってしまう理由を、OCRエンジンの現状を踏まえながら見ていき、対応策を考えてみることにする。 主なAI-OCRエンジンの種類とその精度 まず、日本市場でRPAソフトウェアと一緒に使われることが多い主なOCRを見てみよう。AI-OCRというのは、最近のOCRエンジンは従来の技術に加えてディープラーニングの技術を使って文字の認識や帳票レイアウト

                    【RPA】AI-OCR適用業務選定をする際の注意点 - 精度100%の壁 - Qiita
                  • AppleのVisionフレームワークを利用し、オフラインでもキャプチャした画像内のテキストをコピーできるオープンソースのMac用OCRアプリ「TRex」がリリース。

                    AppleのVisionフレームワークを利用し、オフラインでもキャプチャしたテキストやQR情報をクリップボードにコピーしてくれるオープンソースのMac用OCRアプリ「TRex」がリリースされています。詳細は以下から。 Appleは2017年06月に開催したWWDC2017で、撮影した写真や画像から顔やテキスト、バーコードの検出、オブジェクトのトラッキングをオンデバイスで実行できるVisionフレームワークを発表し、この機能はCore MLと共にAppleのメモや写真アプリで利用されていますが、このVisionフレームワークを利用し、Macでキャプチャした画像からテキストを抽出してくれるOCRアプリ「TRex」がリリースされています。 TRex makes OCR easy and accessible on a Mac.But what is OCR anyway? Imagine you

                      AppleのVisionフレームワークを利用し、オフラインでもキャプチャした画像内のテキストをコピーできるオープンソースのMac用OCRアプリ「TRex」がリリース。
                    • office lens を使ったOCRでやりくりする - やりたいことをやるだけさ

                      大量のデータをOCRさせるソフト GoogleドライブからのOCRは時間がかかりすぎるため別の方法を探していましたが見つかりました。 office lensというマイクロソフトから出てるアプリを使うことでまあまあの解決ができました。 まず初めにこれまでの問題はなんだったかというと Googleドライブに保存した PDFをOCRさせるにはそのPDFファイルの容量が2MB以内であることが条件でした。 けれどわたしの作ったデータは133MB、180ページ分でしたので、OCRできるわけがなかったのです。 これを細かく分割してる時間はめんどくさいのでやりたくない。 OCRの精度も高くなくてはいけない。 色々探した結果、office lensが最適なんじゃないかという結論になりました。 使い方 office lens をアプリストアからダウンロード ワード、one driveもダウンロードしておくこと

                        office lens を使ったOCRでやりくりする - やりたいことをやるだけさ
                      • GitHub - tanreinama/OCR_Japanease: 日本語OCR

                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                          GitHub - tanreinama/OCR_Japanease: 日本語OCR
                        • Googleレンズが、OCRした文字をPCに送る機能が便利すぎる

                          情報管理LOGの@yoshinonです。 今回は、Googleが発表したGoogleレンズによるOCRした文字をPCに送る機能が、すさまじく便利この上ないのでそれをレポートしたいと思います。 この速度感になれると、他のOCRできるアプリを使いたくなくなるかもしれませんよ? まず、Googleレンズとは何か?ということですが、これはGoogleのアプリに附属されている機能で、あまりにも自然に溶け込んでいるので、それと意識することは少ないのではないでしょうか? Googleレンズは、以下のアプリに含まれています。 ・Googleレンズ(Androidのみ) ・Googleアシスタント(Androidのみ) ・Googleフォト(Android、iOS) ・Google検索(iOSのみ) Googleレンズ単体アプリとしてはAndroidのみですが、このようになっています。 では、実際にどこにあ

                            Googleレンズが、OCRした文字をPCに送る機能が便利すぎる
                          • Azure Cognitive Servicesの顔認識(Face)サービスとカスタムOCRのモデルでオンライン本人確認のような仕組みを作ってみる #Azure #CognitiveServices | DevelopersIO

                            Azure Cognitive Servicesの顔認識(Face)サービスとカスタムOCRのモデルでオンライン本人確認のような仕組みを作ってみる #Azure #CognitiveServices こんにちは、Mr.Moです。 前回はカスタムなOCRのモデルを作成してみました。 そこで、今回はカスタムOCRのモデルとAzure Cognitive Servicesの顔認識(Face)サービスを使ってちょっと面白い仕組みを作ってみようと思います。 Azure Cognitive Servicesの顔認識(Face)サービスとは Azure Face サービスは、画像に含まれている人の顔の検出、認識、分析する AI アルゴリズムを提供します。 顔認識ソフトウェアは、セキュリティ、自然なユーザー インターフェイス、画像コンテンツの分析と管理、モバイル アプリ、ロボティクスなど、多種多様なシナリ

                              Azure Cognitive Servicesの顔認識(Face)サービスとカスタムOCRのモデルでオンライン本人確認のような仕組みを作ってみる #Azure #CognitiveServices | DevelopersIO
                            • Building Custom Deep Learning Based OCR models

                              OCR provides us with different ways to see an image, find and recognize the text in it. When we think about OCR, we inevitably think of lots of paperwork - bank cheques and legal documents, ID cards and street signs. In this blog post, we will try to predict the text present in number plate images. What we are dealing with is an optical character recognition library that leverages machine learning

                                Building Custom Deep Learning Based OCR models
                              • 無料のOCRフリーソフト14選!PDFや手書き文字をテキスト化

                                OCR(光学認識技術)とは、紙文書のデータを読み込んでデジタル化する技術のことです。日本のオフィスワーカーの生産性向上を阻む壁のひとつに、大量の紙文書の存在があるとされており、OCRの活用がその解決につながると期待されています。ただ、新たなソフトウェアや技術を導入する時に、まずはスモールスタートで始めてみたいというニーズはあるでしょう。そうした方におすすめしたいのが、フリーソフトの活用です。 OCRのサービス・企業の一覧ページ OCRの仕組み 104サービスをマッピング!AI-OCRカオスマップを無料プレゼント OCRのフリーソフトについてご紹介していく前に、まずはOCRの仕組みについて詳しくみていきましょう。 一般的なOCR処理の場合、スキャナーでスキャニングするだけで実行されるわけではありません。スキャニングを行った後にOCRの専用ソフトを使用してテキストを抽出し、ドキュメントとして出

                                  無料のOCRフリーソフト14選!PDFや手書き文字をテキスト化
                                • 「文字起こし ばりぐっどくん」vs LINE OCRの性能対決をしてみた

                                  まず、「文字起こし ばりぐっどくん」とは、LINE上で友達になり、画像を送ると、ほぼ数秒以内に文字起こし(OCR)をしてくれるというサービスです。 1年ぐらい前にも、そういうサービスがあったのですが、多くの人が殺到してすぐに使えず、さらに今はすでにサービスがお亡くなりになっていたという…。 「文字起こし ばりぐっどくん」をお友達追加するには、このQRコードを読んでください。 または、以下のリンクをタップしてください。 「文字起こし ばりぐっどくん」 を追加 そうすると、「文字起こし ばりぐっどくん」がお友達追加されるので、あとは文字起こししたい画像を送るだけです。 さて、「文字起こし ばりぐっどくん」の話題ばかりだと不公平なので、LINE自体のことも触れていきます。 実は、あまり知られていなさそうなのですが、LINE自体でOCRできるのですよ。 これに関しては、先日記事にしました。 LIN

                                    「文字起こし ばりぐっどくん」vs LINE OCRの性能対決をしてみた
                                  • バクラクOCRにおける機械学習モデルの検証から本番投入までの取り組み - LayerX エンジニアブログ

                                    機械学習エンジニアの吉田です。今年の3月にLayerXに入社し主に機械学習を活用したOCRの開発をしています。それまでルールベースで実装されていた工程を一部機械学習ベースの実装に置き換えつつあり実際に本番でも稼働しています。この記事ではどのように検証や開発を進めてきたのかご紹介します。 背景 LayerXで提供しているバクラクでは帳票をアップロードするだけで支払金額や支払期日などを自動で読み取り補完してくれるOCR機能があります。このOCRは主にルールベースで実装されていましたが、リリースから継続的に改善が行われていたことでかなり精度高く読み取ることができるようになっていました。しかし導入企業様が増えるにつれて次第に精度の改善が困難になり、一箇所修正するとこれまで読み取れていたものが読み取れなくなるなどコードの修正も困難になってきている状況でした。 一方でリリースから1年以上経過し集められ

                                      バクラクOCRにおける機械学習モデルの検証から本番投入までの取り組み - LayerX エンジニアブログ
                                    • Google Drive APIでOCRをしよう! - Qiita

                                      はじめに アクセンチュアの赤石です。必要があって、OCR機能をいろいろ調べています。 Google では、Google Vision APIとGoogle Driveの機能があります。 Google Vision APIの記事 Google Driveの記事 大量にOCRをしたい場合は、普通に考えるとAPIとして使えるGoogle Vision API一択なわけですが、どうも軽くテストした限り、Google Drive APIの方が認識精度が高いみたいなのです。そもそも、同じグーグルで同じ機能のエンジンが2つあることからして謎なのですが。。。 それで、普通であればUI経由で使うGoogle DriveのOCR機能をAPIで使いたいと思ってしまったわけです。 結論として、頑張ればGoogle DriveのOCR機能をAPIで使うことは可能でした。 当記事は、そのための手順を示すものとなります

                                        Google Drive APIでOCRをしよう! - Qiita
                                      • 【Tesseract】Pythonで簡単に日本語OCR - Qiita

                                        0. はじめに 書けるネタを探しながらの投稿ですが、今回はOCRをやってみたので共有します。 なおせっかくなので連載ネタとして考えており、最終的にはGUIアプリをexe化して配布するところまで解説します 【第1回】Pythonで日本語OCR ←今回の記事 【第2回】PythonでオリジナルGUIアプリを作成 【第3回】Pythonで作成したアプリをexe化して配布する 動作環境 OS : Windows10 pro Python : 3.8.3 Tesseract : 5.0.0 pyocr : 0.8 jupyter notebook 1. Tesseractの導入 導入記事は無数にあり、今更ここに書いても冗長になってしまう為、わかりやすく書かれていた以下参考サイト(ひつじ工房様)の「tessreractインストール」の部分で入れていただければOKです。 ・選択肢に紛らわしい「javan

                                          【Tesseract】Pythonで簡単に日本語OCR - Qiita
                                        • Microsoft OCR(Windows.Media.Ocr)は優秀だよというお話 | BTC RPA

                                          お疲れ様です。渡部です。急に寒くなりましたね。皆様お元気ですか。 今日はRPAではなくOCRのお話をしようと思います。 RPAと相性のいいソリューションとしてOCRがあることは皆さんご存知かと思います。 実はWindows10には「Microsoft OCR(Windows.Media.Ocr)」というOCR機能があります。 ※実際にはWin8.1からあるようですが、その当時検証したことがなく。。。 このMicrosoft OCRですが、非常に優秀なので今回紹介します。 今回のサンプルファイルはこちらにします。 この画像ファイルをMicrosoftOCRを含む4つのOCRにかけてみて、結果を見比べたいと思います。 OCR結果MicrosoftOCR給与所得の源泉徴収票 平成30年分 (受給者番号) (個人番号) (役職名) 住所又は居所 払け者 受 支をる (フリガナ) 名 給与所得控除後

                                            Microsoft OCR(Windows.Media.Ocr)は優秀だよというお話 | BTC RPA
                                          • [ Computer Vision (Read API) ] AI-OCRでFAX送信された帳票をCSV化してみました | DevelopersIO

                                            1 はじめに CX 事業本部 delivery部の平内(SIN)です。 一昔前まで、OCRによるテキスト化は、誤変換が多くて、なかなか実用が難しいというイメージがあったのですが、最近のAI-OCRは、日本語や手書きのものも結構な精度で読み取れるようになっています。 そして、モデルは、どんどん更新されているので、今後、ますます、精度は上がっていくでしょう。 今回は、AI-OCRを利用して、帳票をCSV化する作業を試してみました。 2 歪みの修正 FAXで受信した帳票は、やや斜めになったり、歪んでしまうことがあります。この状態では、帳票の枠組みを検出するのが難しいので、長方形になるように補正します。 修正の手順は、以下の通りです。 グレースケール変換 エッジ抽出 膨張処理 最大矩形検出 射影変換 最初にサンプルとなったFAXの画像です。 fax.png 罫線の検出を簡単しやすくするために、グレ

                                              [ Computer Vision (Read API) ] AI-OCRでFAX送信された帳票をCSV化してみました | DevelopersIO
                                            • 全国遺跡報告総覧、類義語およびOCR誤認識用語検索機能を追加

                                              2020年2月15日、奈良文化財研究所が、全国遺跡報告総覧に、類義語およびOCR誤認識用語検索機能を追加したと発表しています。 類義語検索機能は、専門用語の使い方は、専門家の認識や研究史に基づくものの、研究成果を社会に普及する観点からは検索性を確保する必要があることから、用語の類義関係を整理し、内部にシソーラスを構築することで、類義語も含めて検索できるようにしたものです。 OCR誤認識用語検索機能は、印刷物からスキャンした報告書データは、OCR処理によってテキストデータ化されているものの、似ている漢字については誤認識があることから、誤認識されやすい漢字をとりまとめ、専門用語と突合することによって、表記ゆれ専門用語約6万語を生成し、システムに組み込んだものです。 全国遺跡報告総覧:類義語およびOCR誤認識用語検索機能の公開(なぶんけんブログ, 2020/2/15) https://www.n

                                                全国遺跡報告総覧、類義語およびOCR誤認識用語検索機能を追加
                                              • 手書きや印刷された数式をカメラで撮影するだけでLaTeX形式に変換してくれる「Mathpix Snip for Mac/Windows/iOS」が数式だけでなく文章も取り込んでくれる「OCR 2.0」エンジンを搭載。

                                                手書きや印刷された数式をカメラで撮影するだけでLaTeX形式に変換してくれる「Mathpix Snip for Mac/Windows/iOS」が数式だけでなく文章も取り込んでくれる「OCR 2.0」エンジンを搭載しています。詳細は以下から。 Mathpix Snipシリーズはスタンフォード大学の博士課程でディープラーニングを専攻していたNico Jimenezさんらが設立したMathpix, Inc.が開発&公開している数式専用のOCRアプリで、スクリーンショットや写真から数式を判別、LaTeX形式に変換してくれる機能がありますが、このMathpix Snipのデスクトップ版とiOS版がアップデートし、新たにOCRエンジン「OCR 1.0」と「OCR 2.0」を選択できるようになっています。 OCR 2.0 OCR 2.0 is optimized to scan Snips with

                                                  手書きや印刷された数式をカメラで撮影するだけでLaTeX形式に変換してくれる「Mathpix Snip for Mac/Windows/iOS」が数式だけでなく文章も取り込んでくれる「OCR 2.0」エンジンを搭載。
                                                • Azure Cognitive Services の Form Recognizer とラベリングもできる便利ツールでカスタムなOCRモデルを作ってみる #Azure #CognitiveServices | DevelopersIO

                                                  こんにちは、Mr.Moです。 AzureにはCognitive Servicesという優れたAI系のサービスがありますね。 その中で最近ちまちまと触っておりました、Form Recognizerのカスタムモデルを作るのがなかなか面白かったので本エントリーにて情報を残しておこうと思います。 Form Recognizerとは Azure Form Recognizer は、機械学習テクノロジを利用して自動データ処理ソフトウェアを構築ことを可能にするコグニティブ サービスです。 ドキュメントからテキスト、キーと値のペア、選択マーク、テーブル、構造を特定して抽出します。このサービスによって、元のファイル、境界ボックス、信頼度などのリレーションシップを含む構造化データが出力されます。 手作業による操作やデータ サイエンスに関する専門知識があまりなくても、特定のコンテンツに合わせた正確な結果がすばや

                                                    Azure Cognitive Services の Form Recognizer とラベリングもできる便利ツールでカスタムなOCRモデルを作ってみる #Azure #CognitiveServices | DevelopersIO
                                                  • PDFのOCR処理について(無料で変換する方法もご紹介)

                                                    本記事ではOCRを使用して、PDFのテキストを編集可能なデータに変換する方法についてご紹介しています。 フリーソフトやGoogle ドライブ、Adobe Acrobat Pro DCを使用した方法を解説しておりますので、必要の際にお役立てください。 OCR(光学文字認識)とは? OCR(光学文字認識)とは、手書きや印刷された文字をスキャナーやカメラなどの光学的な機械で読み取り、解析することによって、コンピューターで利用できるデジタルなテキストデータに変換する技術のことです。 例えば本一冊を編集可能なデータとしてパソコンに取り込む場合、手作業で文字を入力していたら大変な時間がかかりますが、OCRを使用すれば、作業時間を大幅に削減でき、打ち間違えや二重入力などの人的なミスも防ぐことができます。 OCR処理され、ファイルに埋め込まれたテキストデータには編集を加えることもでき、文字の検索なども可能

                                                      PDFのOCR処理について(無料で変換する方法もご紹介)
                                                    • 10万円給付を迅速に、AI OCRやRPAベンダーによる自治体支援策が続々登場

                                                      火の車になっている自治体の現場を救え――。2020年4月末から5月にかけて、地方自治体におけるオフィスワークの効率化支援策を打ち出すIT企業が相次いでいる。 支援策を打ち出しているのは、AI(人工知能)を組み込んだOCR(光学的文字認識)である「AI OCR」の技術を持つベンダーや、手順が決まったパソコン作業を自動化するRPA(ロボティック・プロセス・オートメーション)のツールベンダーだ。地方自治体は新型コロナウイルス対策の一環で、住民や中小企業に支給する給付金や協力金の支給業務に追われている。 給付金の申請急増を見越し、自治体内の「密」をAI OCRで避ける AI OCRベンダーは主に、国民に一律10万円を給付する「特別定額給付金」の申請書類の内容を、自治体職員がパソコンに入力する作業を効率化する支援策を講じている。政府は新型コロナの緊急経済対策として10万円給付を決め、その受付窓口は自

                                                        10万円給付を迅速に、AI OCRやRPAベンダーによる自治体支援策が続々登場
                                                      • (最終回)Python + OpenCVで遊んでみる(OCR編)

                                                        目次 はじめにOCRとは使用するライブラリ Tesseract,PyOCRを用いたOCR おわりに はじめに 前回までは顔検出や物体検出を静止画や動画で行ってみました。 最終回となる今回は画像ではなく文字を検出・認識するOCRを行ってみたいと思います。 これで画像認識、文字認識と機械学習等の結果でよく利用されるアウトプットを行ってみることができます。 OCRとは OCRとは、 Optical Character Recognition (またはReader)の略で光学文字認識のことを言います。 具体的には画像中の文字を検出し、文字データに変換する技術です。 OCRを利用することで、入力業務や文書管理といった業務を効率よく行えたりします。 当ブログでも別テーマにてOCRを扱った記事を掲載していますので、下記のリンクをクリックしてみてください。

                                                          (最終回)Python + OpenCVで遊んでみる(OCR編)
                                                        • 【C#】文字認識をWindows10のOCRでやってみた!

                                                          C# で画像データの中にある文字を認識するにはどうしたらいいか調べた結果、Windows10 に OCR(文字認識)機能が標準で備わっていることが分かりました。 本記事では Windows10 の文字認識機能を用いて、画像データの文字を認識してテキストデータとして出力するプログラミング方法をまとめてみました。

                                                            【C#】文字認識をWindows10のOCRでやってみた!
                                                          • モルフォ、近代書籍も読み取り可能なAI-OCRソフト「FROG AI-OCR」をリリース

                                                            モルフォグループにおいてAIの事業化を担う、モルフォAIソリューションズは、近代書籍にも対応したAI-OCRソフトウェア「FROG AI-OCR」を2022年7月1日より販売開始します。 このAIニュースのポイント モルフォAIソリューションズがAI-OCRソフトウェア「FROG AI-OCR」を販売予定 自社開発したNDLOCRを活用しており、近代書籍の読取が可能 クラウドでの利用が可能で、OCR処理の他にも校正・テキスト出力機能も搭載 モルフォグループにおいてAIの事業化を担う、株式会社モルフォAIソリューションズは、近代書籍にも対応したAI-OCRソフトウェア「FROG AI-OCR」を2022年7月1日(金)より販売開始します。 モルフォAIソリューションズは、令和3年から国立国会図書館(NDL)の委託事業として図書館向けAI-OCRの開発に従事してきました。開発したNDLOCRは

                                                              モルフォ、近代書籍も読み取り可能なAI-OCRソフト「FROG AI-OCR」をリリース
                                                            • バクラクのAI-OCR機能を支えるアノテーションの仕組み

                                                              2021年のプロダクトリリースから約2年半、導入者数は6000社を突破しデータ数も急速に増える中、AI-OCR機能の精度を担保をするために様々な取り組みをしてきました。今回はデータのアノテーションという観点でリリース前から現在までの取り組みの変遷を紹介します。

                                                                バクラクのAI-OCR機能を支えるアノテーションの仕組み
                                                              • OCR+AIでPDFの画像に説明文を追加 「ChromeOS 116」が公開 ~「Chrome」へも導入予定/「ファイル」アプリの操作性が大きく向上

                                                                  OCR+AIでPDFの画像に説明文を追加 「ChromeOS 116」が公開 ~「Chrome」へも導入予定/「ファイル」アプリの操作性が大きく向上
                                                                • Google ドライブのOCR機能がすごい! | クラウドエース株式会社

                                                                    Google ドライブのOCR機能がすごい! | クラウドエース株式会社
                                                                  • 相性抜群のRPAとOCR、アフラック・J.フロント・LIXILなど大企業で導入ブーム

                                                                    RPA(ロボティック・プロセス・オートメーション)でパソコン作業の自動化を進める企業が続々とOCR(光学的文字認識)の導入も進めている。RPAとOCRを組み合わせて導入するのはなぜか。各社の取り組みから浮かび上がってきたRPA+OCR導入の成果を確実に得るワザとともに紹介する。 「全社規模でRPAの導入を進めるため、適用できる業務の掘り起こしを進めてきた。そのなかで紙の伝票を読み取ってシステムに入力するパソコン作業を自動化できないかという声が業務の現場から多く上がってきた」。大丸松坂屋百貨店やパルコなどを運営するJ.フロント リテイリングの石井勝也業務統括部シェアードサービス推進部スタッフはこう明かす。 同社は2018年春、社内にRPAの専門組織を立ち上げて社内普及を進めてきた。現場の声を受けて、紙文書をスキャンしたデータの内容を読み取ってテキストデータを作成するOCRの導入を進めている。

                                                                      相性抜群のRPAとOCR、アフラック・J.フロント・LIXILなど大企業で導入ブーム
                                                                    • 第770回 UbuntuとOCRmyPDFでスキャンした内容に対して自動的にOCRを実行する | gihyo.jp

                                                                      今回はブラザーのスキャナーでスキャンした結果を自動的にOCRを実行します。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成します。 紙の書類をなんとかしたい ペーパーレスなんて言葉はもう聞き飽きてしまいましたが、実際にペーパーレスが達成されたかというとそういうわけでもないことはみなさんも日々感じていることでしょう。 なにかのサービスに契約したらユーザー名とパスワードは郵送されてくるなんてことはむしろ最近増えています。本人確認のためには致し方ないところではありますが。 昔のWi-Fiルーターはメーカーによって初期ユーザー名とパスワードが決まっていましたが、セキュリティ的には問題しかありません。そのため最近はWi-Fiルーターの箱にユーザー名とパスワードが書かれた紙(某社だとシール)が入っています。たしかにこれだと安心ですが、こんなの失くすに決

                                                                        第770回 UbuntuとOCRmyPDFでスキャンした内容に対して自動的にOCRを実行する | gihyo.jp
                                                                      • 国会図書館、OCR処理プログラム及び学習用データセットを公開 | スラド

                                                                        国立国会図書館は4月25日に、日本語のOCR処理プログラム「NDLOCR」とパブリックドメインOCR学習用データセットの二つを公開した。NDLOCRは国立国会図書館が、モルフォAIソリューションズに委託して制作されたOCR処理プログラムの研究開発事業の成果物をCC BY 4.0ライセンスで公開したものとなっている。商用非商用を問わず自由な改変、利用が可能であるとしている(OCR処理プログラム及び学習用データセットの公開について、NDLOCRリポジトリ)。 パブリックドメインOCR学習用データセットに関しては、同様にLINEに委託したデジタル化資料のOCRテキスト化事業[PDF]において制作されたOCRの性能改善のために作成した機械学習用データセットのうち、著作権保護期間の満了した資料から作成されたものを公開したものだという(パブリックドメインOCR学習用データセット(令和3年度OCRテキス

                                                                        • GoogleフォトでOCRができるようになってテキストを抽出できるようになりました

                                                                          情報管理LOGの@yoshinonです。 今まで無かったのが不思議なくらいだったのですが、GoogleフォトでOCRができるようになりました。そして、そこからテキストを抽出して取り出せることも可能になりました。一眼レフカメラで撮影したものも、iPhoneで撮影したモノも、全てGoogleフォトで管理しているので、非常にありがたい機能です。 今回は、GoogleフォトのOCR機能について取り上げます。 今までとても不思議だったのが、GoogleフォトにOCR機能が無かったことです。 8月23日付けのGoogleフォトのツィートで新機能として紹介されていました。自分的には、「そういえば、そうだったかも?」ぐらいの意外な感じ。 Wow, @googlephotos has OCR to turn screenshots into copy/paste text! A. Open google p

                                                                            GoogleフォトでOCRができるようになってテキストを抽出できるようになりました
                                                                          • 中学生の間に流行る丸文字、クジラ文字などのオリジナル書体。教師たちはOCRで対策 - 中華IT最新事情

                                                                            手書きを重視する中国の教育現場では、中学生の間にオリジナル書体が流行をしている。丸文字など、どの国にもある現象だ。しかし、判読が不能な書体も登場し、教師たちはOCRが認識できるかどうかをひとつの基準にしていると薇薇教育説が報じた。 ICT教育が進んでいるからこそ、手書きを重視する 中国でもICT教育は進んでいるが、特徴的なのは手書きも重視されていることだ。特に中学生までは、手書きによる文字習得が徹底される。授業のノートも手書きであり、試験も手書きだ。現実の社会では、文字を手で書く機会はほとんどなくなっている。そのため、10代前半ぐらいまでの間に、手で文字を書く経験を大量に積ませないと、文字文化の理解ができなくなると考えられている。 独自の書体を編み出す中学生たち 文字をほぼ習得した中学生の間では、誰もが独自の手書き書体を開発しようとし、書体の流行がたびたび起きる。 広く流行したのが「鯨落書

                                                                              中学生の間に流行る丸文字、クジラ文字などのオリジナル書体。教師たちはOCRで対策 - 中華IT最新事情
                                                                            • Torishima @izutorishima 漫画のセリフ等のテキストを OCR するために作られたらしい Manga-OCR、ルビ付き縦書き横書き両対応、加えて多様なフォントへの堅牢性を備えているらしく、シンプルに OSS の日本語 AI OCR ツールとして最高レベルなのでは? Transformers を使ってるんだと(以下スレッド⏬) https://github.com/kha-white/manga-ocr…

                                                                              • 選挙開票になぜAI OCRを導入しないのか理解できない - orangeitems’s diary

                                                                                人力による開票はもう限界だ もう、人力による開票はお金がかかるうえに人間独特の誤りを排除できず、限界ではないでしょうか。 www.jiji.com 静岡県富士宮市選挙管理委員会は23日、参院選比例代表で自民党の山田太郎氏が同市内で得た515票の全てを、れいわ新選組の山本太郎代表の票として扱うミスがあったと発表した。市民からの指摘で発覚した。当落への影響はないという。 人間が行う以上、見間違いや思い込みによる誤検知があるということをまざまざと教えてくれた事例となりました。 電子投票についてはまだ準備が整っていないことはわかりますが、開票自体はもはや機械化すべきではないでしょうか。 今、特にRPAの世界でAI OCRという技術が発達しているのをご存知でしょうか。手書き文字を自動認識し読み取ることができるのです。 今回は、そのAI OCR技術を特集します。 AI OCR事例 2019/7/4 I

                                                                                  選挙開票になぜAI OCRを導入しないのか理解できない - orangeitems’s diary
                                                                                •  史跡看板の写真を一太郎PadアプリでOCR文字起こしする - T’s blog

                                                                                  本日は紅葉を見にいこうよう。と岐阜県まで出かけました。やはりコロナ禍の影響で高速道路もスムーズに通行出来て早めに到着できました。もう12月になるので見頃を逃したかと思って出かけましたが現場はまだ早いくらいでした。着いたのは「養老の滝」といって岐阜県養老郡養老町にある木曽川水系に属する落差32m、幅4mの滝です。日本の滝百選や養老の滝・菊水泉として名水百選に選定されています。また菊水泉にも伝わる古今著聞集に記載されている滝の水がお酒になったという親孝行の伝説「養老孝子伝説」など故事があります。子供の頃に訪れて以来ですので感慨深いものがありました。 落差32mで幅4mの滝なので大人になった今でもはるか上方から落ちてくる水の勢いや水しぶきで爽快な気分になります。この滝の由来を記した看板が2枚ありましたが他のお客もあってゆっくり読んでいられなかったので看板を写真撮影してきました。そのまま写真で読め

                                                                                     史跡看板の写真を一太郎PadアプリでOCR文字起こしする - T’s blog