並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 45件

新着順 人気順

文字認識の検索結果1 - 40 件 / 45件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

文字認識に関するエントリは45件あります。 ocrOCR画像 などが関連タグです。 人気エントリには 『PythonとWinRT OCRで文字認識 - Qiita』などがあります。
  • PythonとWinRT OCRで文字認識 - Qiita

    import cv2 img = cv2.imread('test.jpg') (await winocr.recognize_cv2(img, 'ja')).text pip install jupyterlab jupyter_http_over_ws jupyter serverextension enable --py jupyter_http_over_ws jupyter notebook --NotebookApp.allow_origin='https://colab.research.google.com' --ip=0.0.0.0 --port=8888 --NotebookApp.port_retries=0

      PythonとWinRT OCRで文字認識 - Qiita
    • 深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

      ■イベント 
:【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要 タイトル:深層学習時代の文字認識とその周辺 発表者: 
技術本部 DSOC R&D研究員  宮本 優一 ▼Twitter https://twitter.com/SansanRandD

        深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
      • 簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部

        D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。 ・AI OCR は Google vs Microsoft の構図。 両者精度高。 ・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。 ・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。 スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect

          簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部
        • AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB

          光学式文字認識(OCR)システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 中国の巨大テック企業BaiduのYuning Duらは今回新たに、超軽量のOCRシステムである「PP-OCR」を提案しています。 AI新着論文を自動で取得し、日本語サマリーを毎日メールで受け取るサービスに申し込みが殺到しています。 毎日新しく出版されるAIの論文にキャッチアップするのは、「手間がかかる」「読解が難しい」といった問題あります。 AIDBは、オートで新着論文の探索を行い、❶論文情報❷日本語サマリーを複数掲載するニュースレターサービスを行っています。 ■サービス概要 ① AI新着論文の情報を毎日5件自動で収集 ② 論文のサマリーを記載 ③ キーワードをカスタマイズ可能 ④ 受け取り時間帯を指定可能 下記のフォームから簡単に申し込みが開始できます。 価格は現

            AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB
          • 番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく

            当連載では、漢字改良に挑んだひとりの人生をその著書を通じて書いてきたが、今回は文字自体に焦点をあてる。とりあげるのは前回に引き続きビットマップフォントだ。 前回の記事で明らかになったのは、次のような結論だ。 ビットマップフォントは何かを差し引くではなく、線を重ね合わせ、シェアすることでドットに複数の役割をもたせる。極限まで省略されているようで、実は何も省略していない。 世の中に明朝体と呼ばれる書体が複数ある。同じようにビットマップフォントもさまざまな企業からリリースされている。8ドットや9ドットのビットマップはギリギリまで削減されているように見えた。しかし、このギリギリのなかに取りうる選択肢がフォントの数だけ存在するのだろうか?それとも概ね同じ形に収斂されてゆくのだろうか? 収斂されてゆくのであれば、それが(9ドットの)究極の到達点であり興味深い。また大きな違いが生じるのであれば、簡略化の

              番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく
            • Google BardでOCR文字認識してみた【画像認識】 - Qiita

              まず、英語版のバードに行きます。 画像をアップロードしてほしい情報を入力すると教えていただけます。 生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます フォーマットも指定可能です 有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてます 4桁の番号を教えて 何キロカロリーありますか? まとめ 言われたことしかできない人は、仕事がAIに取られるかもしれません。 信じるか信じないかはあなた次第です 引用 Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you ca

                Google BardでOCR文字認識してみた【画像認識】 - Qiita
              • 【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話

                  【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話
                • 機械学習で実現するヤフーのOCR(文字認識技術)〜 PayPayフリマ 本棚出品での活用事例

                  ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーで画像処理エンジニアをしている吉橋です。この記事ではヤフーのさまざまなサービスで使われている独自の画像文字認識(OCR)技術と、特に最近のPayPayフリマ「本棚一括持ち物追加機能」での活用事例をご紹介します。 画像文字認識とは 皆さん、ウェブサイトを見ていて「このキーワード気になるな……よしコピーしてヤフーで検索してみよう! と思ったらこれ画像じゃん、コピーできないよ……」なんて困ったことはありませんか? ウェブで私たちが目にする情報は“テキスト”と“画像”の2種類が主なものです。 テキスト: 文字列としての情報を保持したデータであり、コピーやウェブ検索に利用したり解析したり、容易に活用できます。 画像データ:

                    機械学習で実現するヤフーのOCR(文字認識技術)〜 PayPayフリマ 本棚出品での活用事例
                  • 第577回 Tesseract OCRで文字認識をする | gihyo.jp

                    今回はオープンソースでマルチプラットフォームのOCRエンジンであるTesseract OCRを使用し、読み取り精度を確認してみます。 UbuntuでOCR? 「日本語でOCR」と聞くと、プロプライエタリの牙城というか、高価なソフトを購入しないと実用に耐えないというイメージがあるかもしれません。あるいはないかもしれませんが、いずれにせよ日本語の文字は難しいのでOCRで高い精度を出すのはなかなか難しそうに思えます。 少なくとも筆者はそう考えていたので、OCRで高精度の結果を出すのは困難、ましてやオープンソースで……と考えていました。そんなところに、Tesseract OCRのバージョン4.0以降では日本語でもかなりの高精度で認識するという話を小耳に挟みました。実際に試してみると想定していた以上の結果だったので、ここで紹介することにします。 Tesseract OCRとgImageReader

                      第577回 Tesseract OCRで文字認識をする | gihyo.jp
                    • 「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン

                      寝ている相手を起こさないように…搭載されたばかりの新機能 2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! この記事の画像(25枚) 使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。 その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。 後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。 若者世代のLINEの使い方は、今もっと進化している! そこで「LINEの便利機能と新常識」をココ調する! 「トークスクショ」「文字認識」あなたは使っている?LINEの便利機能 街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー

                        「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン
                      • iOSで文字認識(Text Recognition)

                        iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 そこで今まではTesseract[2]というオープンソースのOCRエンジンや、SwiftOCR[3]という(おそらく個人がメンテしている)OSSしか選択肢がなかったのですが、つ

                          iOSで文字認識(Text Recognition)
                        • グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化

                          印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleは米国時間9月1日、同社の「Cloud AI」製品群の新製品と新機能を発表した。「Contact Center AI」(CCAI)の新しい製品と機能のほか、「Document AI」の新バージョンなどがある。さらに、機械学習運用(MLOps)担当者向けに「AI Platform」を刷新したことも明らかにした。 Googleは、同社のAI(人工知能)に関する知見が「Google Cloud」の大きな強みだと考えている。「当社のAI研究に関する進歩をクラウドソリューションに生かし、より良い顧客体験を創出できるようにしている」と、Google Cloud AI&Industry Solutionsで責任者を務めるAndrew Mo

                            グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化
                          • 【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog

                            研究開発部Architectグループの堤と申します。新任マネージャーとして自身のキャッチアップも兼ねて、研究開発部の技術や成果物について紹介する記事を書いています。 第三弾となる今回は、Sansanの名刺データ化フローの中で使われている弊社が独自開発した名刺に特化した文字認識エンジン「NineOCR」についてご紹介します。 Sansanの名刺データ化フロー NineOCRについては本日プレスリリースが出た通り、データ化範囲が名刺記載の「全項目」 1 となり、いずれの項目でも高い読み取り精度を実現しています。 独自開発の背景 名刺のデータ化では、Emailアドレスや電話番号などを1文字間違えただけでも大問題です。 Sansanでは従来より、オペレーションセンターでの人力処理とコンピュータによる処理をうまく組み合わせて、高精度を維持しつつ、コスト削減やスケーラビリティの両立を実現してきました。

                              【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog
                            • PythonとTesseract OCRで文字認識 - Qiita

                              概要 Pythonの勉強をしている時に良い題材がないかを調べている際、文字認識について興味があったので一緒に使って勉強しようと思いました。 オープンソースで使用可能なOCRはTesseract OCRが優秀だということでこちらを使ってみたいと思います。 Tesseract OCRのインストール 今回はTesseract OCR4.0以降を使用します。 ダウンロード 公式ページ https://github.com/tesseract-ocr/tesseract windowsの場合 自力でコンパイルしても良いが、Windows用インストーラが用意されているのでそちらを実行してインストールを行う。 wikiの「Windows」項目内の「Tesseract at UB Mannheim」をクリック 遷移先のページの32bitもしくは64bitのどちらかをダウンロード。 古いバージョンが欲しい場

                                PythonとTesseract OCRで文字認識 - Qiita
                              • Python と Tesseract OCR を使って文字認識をしてみよう! - GIS奮闘記

                                本日は Python と Tesseract OCR を使って文字認識をしてみようと思います。みなさんは OCR と聞いてピンときますか?実は私たちの周りは OCR を使用したテクノロジーで溢れかえっています。 OCR とは? OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術のことです。この技術を利用することによって、例えば、紙に書かれている情報を毎回パソコンで手入力しなければいけない、ということはよくあるかと思います。OCR を使うことによってこの作業を自動化することができるようになります。 最近はフリーの OCR エンジン が普及していており、プログラミング で OCR を扱うことが

                                  Python と Tesseract OCR を使って文字認識をしてみよう! - GIS奮闘記
                                • LINEのAI技術を販売する「LINE BRAIN」開始 チャットbotや文字認識、音声認識技術を提供

                                  自然言語の理解・応答技術の「LINE BRAIN CHATBOT」は、LINEの調査によれば、質問に対する応答で他社のチャットbotよりも正答率が高いという。販売するチャットbot技術は、LINE以外のサービスにも実装できる。 「LINE BRAIN OCR」は、画像内の文字を認識してテキストデータに変換する技術。スクリーンショット内の文字などを高い精度で認識するという。領収書の読み取りや、申込書、注文書、免許証の登録などでの活用を見込む。 「LINE BRAIN SPEECH TO TEXT」は、音声をテキストデータに変換する技術。長文の書き起こしや製品名など固有名詞にも対応する。コールセンターのオペレーター支援や動画音声の字幕起こしなどに利用できるという。 LINEの舛田淳取締役CSMO(最高戦略マーケティング責任者)は27日に行った自社イベント「LINE CONFERENCE 201

                                    LINEのAI技術を販売する「LINE BRAIN」開始 チャットbotや文字認識、音声認識技術を提供
                                  • 手書き文字認識に適さない画数の多い漢字ども【追記有】

                                    スマホでの文字入力に手書き認識を使っているけど、画数の多い漢字は本当クソ(KUSO)。中国式で簡略化してほしい。 🌋 例えば、「書」とか。門構えもクソ。これを書いているうちに「門」という文字がヒットして終わり。問とか間とか書けない。草書体みたいに簡略して書くと「同」がヒットする。問といえば問題の題の方もダメだ。頻繁につかう単語なのに画数が多すぎる。それが問題だ!!!!!ほかにも「響」とか・・ 🌋 手書き文字認識に適した漢字だけ残すとか・・簡略化するとか・・なんとかしてよ!!画数が多くて嬉しいのって書道家くらいちゃうんか?あとハンコヤ? 🌋 候補に旧字体とか異体字まで出すの止めてほしい。日本は敗戦のショックで「なるべく使わんでもよい文字はやめましょう」って当用漢字を決めたのに、なんだかダラダラと増やしやがって。しかも異体字まで簡単に入力できるようになって、「私の斉は斉じゃないです」とか

                                      手書き文字認識に適さない画数の多い漢字ども【追記有】
                                    • 「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介(FNNプライムオンライン) - Yahoo!ニュース

                                      寝ている相手を起こさないように…搭載されたばかりの新機能2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! 使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。 その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。 後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。 若者世代のLINEの使い方は、今もっと進化している! そこで「LINEの便利機能と新常識」をココ調する! 「トークスクショ」「文字認識」あなたは使っている?LINEの便利機能街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー: トークスクショ機能といって

                                        「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介(FNNプライムオンライン) - Yahoo!ニュース
                                      • 不在票に謎のメッセージ「ママどこ」 事件発生かと思ったらAmazonだった宅配物に「ホラー」「文字認識力が試される」

                                        帰ったらポストには送り主に「ママどこ」(?)と書かれた謎の不在票が……! ちょっと戸惑ったという1枚の画像がTwitter上で注目を集めています。 宅配便の送り主は一見すると「ママどこ」。不在票を受け取ったTwitterユーザーの放射線技師のノブ(偽)(@RadiNOBU)さんも一瞬戸惑ったようですが、よくよく見ると……そう、これは「アマゾン」。実はAmazon.co.jpからの宅配物だったのでした。 この偶然の産物は「『奥におきます』もちょっと怖い」「確かにこれ入ってたら怖いwww」「クリティカルに一撃貰ったw」などの声とともに2万件以上のリツイートと、10万件以上の「いいね」を集めました。 突然の「ママどこ」に思わずいろいろ想像を巡らせてしまいますが、分かるとクスッとなる不在票なのでした。 画像提供:放射線技師のノブ(偽)(@RadiNOBU)さん ネットの反応 advertiseme

                                          不在票に謎のメッセージ「ママどこ」 事件発生かと思ったらAmazonだった宅配物に「ホラー」「文字認識力が試される」
                                        • ニューラルネットワークをガラス板で実装し電源なしで動作する手書き文字認識装置 | スラド ハードウェア

                                          90曰く、 ニューラルネットワークを使った手書き文字認識システムを、ガラスを使って実装する試みがHACKADAYで紹介されている。ガラス板に入力される光を使い、電力なしに動作するという。 穴をあけるなどして特別に細工された薄板に、光強度の組として量子化された画像を入力すると、その光が読み取り部に集中して推論結果を示す。物理的には静的なガラス板で電源は不要だが、手書き数字データセットのMNISTを使った実験結果では入力画像1000点に対し精度は79%と低め。

                                          • Google ドライブで OCR(文字認識)と表の作り方+北海道難読地名 - チコちゃんに叱られないブログ

                                            北海道難読地名を画像で紹介しましたが、幾つ読めたでしょうか? その北海道難読地名の読み方を紹介します。 ここには30点紹介しましたが北海道には難読地名はまだまだ山ほどあります。元はアイヌ語の発音に漢字を、何というのか、強引に漢字をあてはめただけみたいにも思えます。いまでいうところの中二病的地名の宝庫みたいで夜露死苦です。 北海道難読地名30問 1 国縫 くんぬい 2 長万部 おしゃまんべ 3 蛇田 あぶた 4 虎杖浜 こじょうはま 5 倶知安 くっちゃん 6 積丹 しゃこたん 7 真狩 まっかり 8 妹背牛 もせうし 9 美唄 びばい 10 増毛 ましけ 11 比布 ぴっぷ 12 安足間 あんたろま 13 留辺蘂 るべし 14 白老 しらおい 15 白人 ちろっと 16 弟子屈 てしかが 17 興部 おこっぺ 18 椴法華 とどほっけ 19 女満別 めまんべつ 20 常 呂 ところ 21

                                              Google ドライブで OCR(文字認識)と表の作り方+北海道難読地名 - チコちゃんに叱られないブログ
                                            • 【C#】文字認識をWindows10のOCRでやってみた!

                                              C# で画像データの中にある文字を認識するにはどうしたらいいか調べた結果、Windows10 に OCR(文字認識)機能が標準で備わっていることが分かりました。 本記事では Windows10 の文字認識機能を用いて、画像データの文字を認識してテキストデータとして出力するプログラミング方法をまとめてみました。

                                                【C#】文字認識をWindows10のOCRでやってみた!
                                              • 文字認識アルゴリズムのFOTSを実装したので,1から解説してみる(EASTも少し) - Qiita

                                                はじめに 例によって暇だったため,FOTS(Fast Oriented Text Spotting with a Unified Network)をPytorchで実装してみました.実装はこちら→https://github.com/jjjkkkjjj/pytorch.dlで,FOTS意外にも気まぐれでいろんなアルゴリズムを実装しています.今回の実装では,学ぶことも多かったので,アウトプットも含めてFOTSを1から解説してみたいと思います.また,FOTSはEAST(An Efficient and Accurate Scene Text Detector)から踏襲した部分も多いので,EASTの解説も含んでいると思います. ちなみに,以下が実装したFOTSの出力結果です.ところどころおかしいですが,いい感じですね〜. 入力画像 出力画像 FOTSとは FOTSとは,その名(Fast Orie

                                                  文字認識アルゴリズムのFOTSを実装したので,1から解説してみる(EASTも少し) - Qiita
                                                • Google Keepの手書き文字認識の性能が爆上がりしている件について

                                                  とても使い勝手の良いアプリで、iOS純正のメモアプリより多用しています。 Google系のサービスをメインで使っている人だったら、これを使わない手はないのではないでしょうか? 最近は、GmailやGoogleカレンダーとの連携がスゴイのですよ。 こんな感じにサイドのボタンがありますよね。 ここで新規作成すると、メールへのショートカットが自動的に挿入されるのですよ。めっちゃ便利ですよね。 さて、今回の本題に入ります。 Google Keepに手書き文字認識なんてあったっけ?と思われる人いますよね? 公式には、ないです。偶然気がつきました。 Google Keepで新規作成すると、このようなメニューが出てきます。 ここで、「図形描画」を選択します。 そして、手書きで文字を書くのですよ。 描画なので画像になるわけなのですが、画像自体をタップして、右上の三点アイコンをタップすると、「画像のテキスト

                                                    Google Keepの手書き文字認識の性能が爆上がりしている件について
                                                  • iPadの手書き文字認識「スクリブル」、iPadOS 15の日本語対応でこんなに便利

                                                    毎年秋の登場が恒例になっている「iOS」「iPadOS」のメジャーアップデート。2021年は「iOS 15」「iPadOS 15」となる。正式リリースはまだ先だが、「Apple Beta Software Program」という無料のプログラムに登録すると、端末のユーザーなら誰でも現時点のパブリックベータ版をインストールして試すことができる。 今回はiPadOS 15で対応予定の「日本語手書き文字認識」機能の使い方を詳しく紹介する。正式版で試した上で記事にするのが筆者のポリシーなのだが、日本語手書き文字認識にとても感激したため、今回は速報性を優先しベータ版を試した。 英語などの手書き文字認識は「iPadOS 14」で既に対応し、操作方法はiPadOS 15のベータ版にも引き継がれている。正式版で大きく変更されることはまずないと考えているが、それでも正式版とは異なる可能性がある点に注意してほ

                                                      iPadの手書き文字認識「スクリブル」、iPadOS 15の日本語対応でこんなに便利
                                                    • Google Cloud Vision APIのOCRを使ってPythonから文字認識する方法

                                                      こんにちは、業務自動化ツール開発担当の吉池(@valmore_myoshi)です。 今回はGoogle Cloud Vision APIのOCRを使用して画像から文字認識する方法を解説します。さまざまな言語で扱えますが本記事ではPythonを使いたいと思います。 Cloud Vision APIの精度を試したり、使い方を学ぶときにお役立てください。 Cloud Vision APIとは? Cloud Vision APIは画像認識に特化したAPIです。画像から顔を検出したり、写っているものを識別できます。本記事ではそのなかでもOCRを使ったテキスト検出に絞って解説します。 REST APIやさまざまな言語ごとに用意されているクライアントライブラリを通してCloud Vision APIを使用できます。Cloud Vision APIでできることや精度を知りたい方は画像をアップロードするだけ

                                                        Google Cloud Vision APIのOCRを使ってPythonから文字認識する方法
                                                      • ゲーム画面の画像認識 → 文字認識 → 文字起こし の流れをリアルタイムに行う - Qiita

                                                        1. はじめに PyOCRを利用した文字認識に挑戦中のメモ書きです。 こういった場での公開は初めてなので、至らない点もあるかと思いますがよろしくお願いします。 好きなゲームの布教・翻訳を目的に作り始めたのでこんな記事タイトルをしてますが、記事の文字起こしや動画の字幕など何にでも使えると思います。 読み上げソフトに打ち込む際にちょっとだけ便利かもしれません。 2. ざっくりフロー PyAutoGuiで指定範囲のスクリーンショットを撮影 OpenCVでグレースケール、拡大 PyOCRで文字認識、テキスト出力 左上隅の座標を取得します 658,502 右下隅の座標を取得します 1196,602 【原文】 ------------------------------------ いつ頃からか出来上がった召喚という技術は、 様々な世界から技術、 人、 物を運んできたが、 この画期的な技術に少々浮かれ

                                                          ゲーム画面の画像認識 → 文字認識 → 文字起こし の流れをリアルタイムに行う - Qiita
                                                        • 東芝デジタルソリューションズ、ディープラーニングで手書き文字認識精度を向上させた「AI OCR文字認識サービスV2.0」提供開始

                                                            東芝デジタルソリューションズ、ディープラーニングで手書き文字認識精度を向上させた「AI OCR文字認識サービスV2.0」提供開始
                                                          • アップル「iPadOS 15」は日本語の手書き文字認識に対応で、仕事にも勉強にも便利 (1/5)

                                                            秋に正式リリースを予定する「iPadOS 15」のパブリックベータ版をテスト。Apple Pencilに関連する注目機能を試してみました アップルが、2021年の秋に正式リリースを予定する「iPadOS 15」のパブリックベータ版を公開しています。専用デジタルペンのApple Pencilによる手書き作業が、さらに便利になりそうな3つの新機能に注目しました。 iPadOS 15はパブリックベータ版も同様、2014年に発売されたiPad Air 2、2015年モデルのiPad mini 4から最新の現行iPadシリーズまで幅広く対応しています。Apple IDと対応するiPadを持っていれば、パブリックベータのソフトウェアは誰でも無料でダウンロードして試せます。 現行のiPadはすべてのモデルが第1世代、または第2世代のApple Pencilによる手書き入力に対応します。筆者は本稿でiPa

                                                              アップル「iPadOS 15」は日本語の手書き文字認識に対応で、仕事にも勉強にも便利 (1/5)
                                                            • Rails+Google Cloud Vision APIで文字認識を実装してみた|TechRacho by BPS株式会社

                                                              こんにちは、BPSの福岡拠点として一緒にお仕事させて頂いてます、株式会社ウイングドアの坂本です。 日頃よくお客様から「OCR(光学的文字認識)をつかって画像から文字を抽出して〜(うんぬんかんぬん)」 という要望を頂きます。 以前は少しハードルが高く感じていましたが最近はいくつかのサービスでOCRのAPIを提供されており、 大分手を出しやすくなったのではないでしょうか? 先日、RailsでそのGoogle CloudのVision APIを利用した検証用デモを作成しました。 意外とRubyの記事は少なかったため少しでも役に立てばと実装例と使ってみた所感をご紹介したいと思います。 前提 デモ作成の目的はOCRで以下の要件が満たせそうか検証すること。 そのため以下の要件を意識しながらデモを作成しています。 日本語を含む手書きの表を読み取れること(今回はシフト表を想定) 表の中身の項目は複数ある文

                                                                Rails+Google Cloud Vision APIで文字認識を実装してみた|TechRacho by BPS株式会社
                                                              • Google Cloud Vision APIで文字認識を試してみる - Qiita

                                                                はじめに オープンストリーム Advent Calendar 2018の12日目です。 「AWS絡みで何か書きます」と宣言しておいて、これから書くのは事もあろうにGoogle Cloud Platformの記事という。 元々書こうと思っていたネタが、思ったよりどん詰まってしまい、可作業時間的に無理だと思ったのでネタを変えることにしました。 今回のテーマに挙げたのは、「OCR(光学式文字認識)」です。画像から文字を認識する、アレです。 ちょっとした思いつきで、OCRを使って作ってみようかな、と思ったアプリがあるため、前段階としてOCRを検証してみることにしました。 ということで、GCPのCloud Vision APIを使って、OCRがどのレベルまで文字を識別してくれるのか試してみることにしました。 ちなみに、GCP経験少ないので、もっと楽なやり方あればご教授ください。 前準備 AWSと同様

                                                                  Google Cloud Vision APIで文字認識を試してみる - Qiita
                                                                • iPhoneで日本語OCR、文字認識が使える - Qiita

                                                                  文字認識をかんたんにつかえる iPhoneで文字認識できたら、板書の書き起こしや、標識認識アプリなど便利につかえます。 2022年のアップデートで日本語が利用可能に 2022年のiOS16から、日本語の文字認識が可能になりました。 組み込みのフレームワークのみで可能です。 精度もかなり良く、さまざまなアプリで実用に耐えるレベルだと個人的には思います。 つかいかた VisionのVNRecognizeTextRequestをつかいます。 recognitionLanguages に "ja" を指定します。 macOS13、Xcode14、iOS16以降が必要です。 let request = VNRecognizeTextRequest() request.recognitionLanguages = ["ja"] // 日本語を指定 let handler = VNImageReques

                                                                    iPhoneで日本語OCR、文字認識が使える - Qiita
                                                                  • [iPhone駆け込み寺] iPhone「iOS 16」で写真中の文字認識機能が日本語対応。けっこう使える機能になってる!

                                                                      [iPhone駆け込み寺] iPhone「iOS 16」で写真中の文字認識機能が日本語対応。けっこう使える機能になってる!
                                                                    • Windows 10に搭載されているMicrosoft OCRを使って文字認識する – RIALAB.

                                                                      Windows 10に搭載されているMicrosoft OCRを使って文字認識する 木曜日 , 11, 3月 2021 makoto .NET, Windows, 技術的なメモ 1 Comment 文字認識が必要になりそうなお仕事で、実装方法と難しさ、文字認識の精度を調べるために作った簡易OCRツールです。 Windows 10に標準搭載されているOCR( Microsoft OCR / Windows.Media.Ocr )を使っただけなのですが、機能として面白かったのでプログラムとソースを公開します。 ※実行画面のサンプルとして、青空文庫で公開されている『吾輩は猫である』のスクリーンショットを使用しました。 ※2022/02/05 『GUI対応したPDFをページごとに画像変換(PNG/BMP/JPEG/GIF/TIFF形式)するツール [WPF]』で応用アプリケーションを掲載しました。

                                                                      • iPadの手書き文字認識機能「スクリブル」を使いこなそう - iPadパソコン化講座

                                                                        前回の「クイックメモ」に引き続き、今回はiPadOS 15で新しく搭載された「スクリブル」について紹介したいと思います。スクリブル(Scribble)は、簡単に言えば「手書き文字の認識機能」です。Apple Pencilを使って入力した手書きの文字をキーボードでタイピングしたように自動でテキストデータに変換してくれます。iPadOS 14では英語や中国語などの一部の言語に限られていましたが、iPadOS 15で晴れて日本語にも対応しました。iPadに加えてApple Pencil(またはApple Pencil互換ペン)が必要となりますが、「iPadへの入力」を一変させる素晴らしい機能ですのでぜひ活用してみてほしいと思います。 Apple Pencilで書き込むだけ スクリブルを利用するのは実に簡単です。「設定」アプリから[Apple Pencil]を開くと[スクリブル]の設定項目がありま

                                                                          iPadの手書き文字認識機能「スクリブル」を使いこなそう - iPadパソコン化講座
                                                                        • 図書館情報学とAIの新展開 ーAI文字認識×クラウドソーシングで史料のテキスト化を加速【第2回 人工知能学会誌コラボ】 | AI専門ニュースメディア AINOW

                                                                          図書館情報学とは 図書館情報学とは、図書の収集・分類・保存・利用に関する諸問題を研究する図書館学と、情報の利用やあり方について研究する情報学とを合わせた学問領域です。 図書館にいくと膨大な数の本がきれいに整理され、決められた場所に並んでいます。このおかげで利用者の私たちは難なく本を探すことができます。 このように、図書館にある古くからの膨大な本や論文などの情報をいかに効率的に正しく収集し、保存していくのかを研究し突きつめきたのが図書館学でした。 1970年代に入るとコンピューターが広く普及し、情報検索が容易になってきました。それに伴い図書館の情報化も大きく進展し、従来の図書館学に加えてコンピューターを利用することを前提とした図書館情報学が成立しました。 図書館情報学では、知りたい情報を効率的に検索し、利用できるような環境づくりとその整備、情報の取り扱いなど、図書館に限らないあらゆる事象が研

                                                                            図書館情報学とAIの新展開 ーAI文字認識×クラウドソーシングで史料のテキスト化を加速【第2回 人工知能学会誌コラボ】 | AI専門ニュースメディア AINOW
                                                                          • 低価格FPGAを用いた文字認識AI推論の全体像

                                                                            FPGAにニューラルネットワークを実装するプロセスを学ぶ本連載。第1回では、連載の狙いや、文字認識AIモデルの概要、どのようにFPGA上で文字認識を行うかなど全体の流れを紹介する。 はじめに 本連載は、PCで学習した文字認識のAI(人工知能)モデルのニューラルネットワークを、低価格で入手できるFPGA開発ボードに実装して推論実行することを目指します。第1回記事である本稿では、筆者が何をしようとしているのか、またどこを目指しているのかを共有するために全体的な流れを紹介したいと思います。 使用するのは低価格のFPGA開発ボード「Tang Nano 9K」 今回は、8×8のLEDドットマトリックス上の5×5ドットの枠内に表示された文字を認識するニューラルネットワークを用います。学習はPCで行い、推論(実行)はFPGAで行います。 FPGA開発ボードはSipeedが製造/発売している「Tang N

                                                                              低価格FPGAを用いた文字認識AI推論の全体像
                                                                            • クイックスタート: 光学式文字認識 (OCR) - Azure AI services

                                                                              このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。

                                                                                クイックスタート: 光学式文字認識 (OCR) - Azure AI services
                                                                              • ユーザーローカル、手書き文字認識AIのAPIを無償提供

                                                                                ユーザーローカルは28日、同社が開発した「ユーザーローカル 手書き文字認識AI」の提供を開始。APIを通じて無償で利用できるもので、Web上でマウス操作で試せるWebページを公開している。ディープラーニングを用いたAIは、ひらがな、カタカナ、常用漢字、英字、記号など、くずし字や略字にも対応する手書き文字を画像から読み取るもので、Web APIで自社システムに文字認識機能を手軽に組み込める。APIドキュメントは、Webページの資料ダウンロードから必要事項を記入・送信すると入手できる。

                                                                                  ユーザーローカル、手書き文字認識AIのAPIを無償提供
                                                                                • 無料で使える「手書き文字認識AI」 ユーザーローカルが提供を開始

                                                                                  ユーザーローカルによると「近年、業務効率改善やデータ活用のためにデジタル化を進める動きが活発になっており、そのためには文書のデジタル化が必要だ。しかし、手書き文字のOCR(光学文字認識)ではコストがかかり、デジタル化を妨げる要因となっていた」という。 くずし字や略字も認識 関連記事 無償で利用できる「数理、データサイエンス、AI」の教材を公開 東京大学 東京大学の数理・情報教育研究センターは「数理・データサイエンス・AIモデルカリキュラム」に準拠した教材の無償公開を開始した。クリエイティブ・コモンズ・ライセンス(CC BY-NC-SA)で利用できる。 「考えただけ」で文字を入力できるAIシステムを開発 脳の運動皮質に埋め込んだデバイスから得たデータをAIが解釈することで、四肢の不自由な患者がテキストでコミュニケーションできるシステムをスタンフォード大学の研究チームが開発した。 DXにはデジ

                                                                                    無料で使える「手書き文字認識AI」 ユーザーローカルが提供を開始

                                                                                  新着記事