並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 45件

新着順 人気順

文字認識の検索結果1 - 40 件 / 45件

  • 低価格FPGAを用いた文字認識AI推論の全体像

    FPGAにニューラルネットワークを実装するプロセスを学ぶ本連載。第1回では、連載の狙いや、文字認識AIモデルの概要、どのようにFPGA上で文字認識を行うかなど全体の流れを紹介する。 はじめに 本連載は、PCで学習した文字認識のAI(人工知能)モデルのニューラルネットワークを、低価格で入手できるFPGA開発ボードに実装して推論実行することを目指します。第1回記事である本稿では、筆者が何をしようとしているのか、またどこを目指しているのかを共有するために全体的な流れを紹介したいと思います。 使用するのは低価格のFPGA開発ボード「Tang Nano 9K」 今回は、8×8のLEDドットマトリックス上の5×5ドットの枠内に表示された文字を認識するニューラルネットワークを用います。学習はPCで行い、推論(実行)はFPGAで行います。 FPGA開発ボードはSipeedが製造/発売している「Tang N

      低価格FPGAを用いた文字認識AI推論の全体像
    • iOSで文字認識(Text Recognition)

      iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 そこで今まではTesseract[2]というオープンソースのOCRエンジンや、SwiftOCR[3]という(おそらく個人がメンテしている)OSSしか選択肢がなかったのですが、つ

        iOSで文字認識(Text Recognition)
      • Google BardでOCR文字認識してみた【画像認識】 - Qiita

        まず、英語版のバードに行きます。 画像をアップロードしてほしい情報を入力すると教えていただけます。 生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます フォーマットも指定可能です 有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてます 4桁の番号を教えて 何キロカロリーありますか? まとめ 言われたことしかできない人は、仕事がAIに取られるかもしれません。 信じるか信じないかはあなた次第です 引用 Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you ca

          Google BardでOCR文字認識してみた【画像認識】 - Qiita
        • 【やってみた】EasyOCRで文字認識! - 神戸のデータ活用塾!KDL Data Blog

          株式会社神戸デジタル・ラボ DataIntelligenceチームの原口です。 今回は、GitHubで公開されているAIモデル「EasyOCR」を用いて文字認識に取り組みます! 本稿は、以下の条件に当てはまる方を想定して発信します。 Pythonが利用できる方 新しい技術に興味がある方 文字認識に興味がある方 OCRとは? 利点1:認識した文字をデータとして利用することができる 利点2:他言語へ簡単に翻訳できる EasyOCRとは? 準備 実際に検出してみた まとめ OCRとは? OCRの流れ OCR(Optical Character Recognition または Reader)とは、紙面上に存在する文字をカメラで撮影し、その画像をプログラムやAIで解析することで、紙面上の文字をデジタルデータに変換する技術のことを指します。 紙面上に存在する文字をデジタルデータに変換すると、どのような

            【やってみた】EasyOCRで文字認識! - 神戸のデータ活用塾!KDL Data Blog
          • 【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog

            研究開発部Architectグループの堤と申します。新任マネージャーとして自身のキャッチアップも兼ねて、研究開発部の技術や成果物について紹介する記事を書いています。 第三弾となる今回は、Sansanの名刺データ化フローの中で使われている弊社が独自開発した名刺に特化した文字認識エンジン「NineOCR」についてご紹介します。 Sansanの名刺データ化フロー NineOCRについては本日プレスリリースが出た通り、データ化範囲が名刺記載の「全項目」 1 となり、いずれの項目でも高い読み取り精度を実現しています。 独自開発の背景 名刺のデータ化では、Emailアドレスや電話番号などを1文字間違えただけでも大問題です。 Sansanでは従来より、オペレーションセンターでの人力処理とコンピュータによる処理をうまく組み合わせて、高精度を維持しつつ、コスト削減やスケーラビリティの両立を実現してきました。

              【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog
            • 不在票に謎のメッセージ「ママどこ」 事件発生かと思ったらAmazonだった宅配物に「ホラー」「文字認識力が試される」

              帰ったらポストには送り主に「ママどこ」(?)と書かれた謎の不在票が……! ちょっと戸惑ったという1枚の画像がTwitter上で注目を集めています。 宅配便の送り主は一見すると「ママどこ」。不在票を受け取ったTwitterユーザーの放射線技師のノブ(偽)(@RadiNOBU)さんも一瞬戸惑ったようですが、よくよく見ると……そう、これは「アマゾン」。実はAmazon.co.jpからの宅配物だったのでした。 この偶然の産物は「『奥におきます』もちょっと怖い」「確かにこれ入ってたら怖いwww」「クリティカルに一撃貰ったw」などの声とともに2万件以上のリツイートと、10万件以上の「いいね」を集めました。 突然の「ママどこ」に思わずいろいろ想像を巡らせてしまいますが、分かるとクスッとなる不在票なのでした。 画像提供:放射線技師のノブ(偽)(@RadiNOBU)さん ネットの反応 advertiseme

                不在票に謎のメッセージ「ママどこ」 事件発生かと思ったらAmazonだった宅配物に「ホラー」「文字認識力が試される」
              • 機械学習で実現するヤフーのOCR(文字認識技術)〜 PayPayフリマ 本棚出品での活用事例

                ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーで画像処理エンジニアをしている吉橋です。この記事ではヤフーのさまざまなサービスで使われている独自の画像文字認識(OCR)技術と、特に最近のPayPayフリマ「本棚一括持ち物追加機能」での活用事例をご紹介します。 画像文字認識とは 皆さん、ウェブサイトを見ていて「このキーワード気になるな……よしコピーしてヤフーで検索してみよう! と思ったらこれ画像じゃん、コピーできないよ……」なんて困ったことはありませんか? ウェブで私たちが目にする情報は“テキスト”と“画像”の2種類が主なものです。 テキスト: 文字列としての情報を保持したデータであり、コピーやウェブ検索に利用したり解析したり、容易に活用できます。 画像データ:

                  機械学習で実現するヤフーのOCR(文字認識技術)〜 PayPayフリマ 本棚出品での活用事例
                • [iPhone駆け込み寺] iPhone「iOS 16」で写真中の文字認識機能が日本語対応。けっこう使える機能になってる!

                    [iPhone駆け込み寺] iPhone「iOS 16」で写真中の文字認識機能が日本語対応。けっこう使える機能になってる!
                  • 「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン

                    寝ている相手を起こさないように…搭載されたばかりの新機能 2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! この記事の画像(25枚) 使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。 その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。 後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。 若者世代のLINEの使い方は、今もっと進化している! そこで「LINEの便利機能と新常識」をココ調する! 「トークスクショ」「文字認識」あなたは使っている?LINEの便利機能 街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー

                      「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン
                    • 「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介(FNNプライムオンライン) - Yahoo!ニュース

                      寝ている相手を起こさないように…搭載されたばかりの新機能2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! 使い方は、LINEの右上にある設定アイコンをタップして「LINE Labs」を選択。 その中にある、「ミュートメッセージ」の設定をONにすれば、準備OK。 後は送信ボタンを長押しして、ミュートメッセージを選んで送れば、相手の通知音は鳴らさずに、メッセージを送ることができる。 若者世代のLINEの使い方は、今もっと進化している! そこで「LINEの便利機能と新常識」をココ調する! 「トークスクショ」「文字認識」あなたは使っている?LINEの便利機能街で、よく使うLINEの機能を聞いてみると… 街頭インタビュー: トークスクショ機能といって

                        「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介(FNNプライムオンライン) - Yahoo!ニュース
                      • iPhoneで日本語OCR、文字認識が使える - Qiita

                        文字認識をかんたんにつかえる iPhoneで文字認識できたら、板書の書き起こしや、標識認識アプリなど便利につかえます。 2022年のアップデートで日本語が利用可能に 2022年のiOS16から、日本語の文字認識が可能になりました。 組み込みのフレームワークのみで可能です。 精度もかなり良く、さまざまなアプリで実用に耐えるレベルだと個人的には思います。 つかいかた VisionのVNRecognizeTextRequestをつかいます。 recognitionLanguages に "ja" を指定します。 macOS13、Xcode14、iOS16以降が必要です。 let request = VNRecognizeTextRequest() request.recognitionLanguages = ["ja"] // 日本語を指定 let handler = VNImageReques

                          iPhoneで日本語OCR、文字認識が使える - Qiita
                        • 【C#】文字認識をWindows10のOCRでやってみた!

                          C# で画像データの中にある文字を認識するにはどうしたらいいか調べた結果、Windows10 に OCR(文字認識)機能が標準で備わっていることが分かりました。 本記事では Windows10 の文字認識機能を用いて、画像データの文字を認識してテキストデータとして出力するプログラミング方法をまとめてみました。

                            【C#】文字認識をWindows10のOCRでやってみた!
                          • 深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

                            ■イベント 
:【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要 タイトル:深層学習時代の文字認識とその周辺 発表者: 
技術本部 DSOC R&D研究員  宮本 優一 ▼Twitter https://twitter.com/SansanRandD

                              深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
                            • iPadの手書き文字認識機能「スクリブル」を使いこなそう - iPadパソコン化講座

                              前回の「クイックメモ」に引き続き、今回はiPadOS 15で新しく搭載された「スクリブル」について紹介したいと思います。スクリブル(Scribble)は、簡単に言えば「手書き文字の認識機能」です。Apple Pencilを使って入力した手書きの文字をキーボードでタイピングしたように自動でテキストデータに変換してくれます。iPadOS 14では英語や中国語などの一部の言語に限られていましたが、iPadOS 15で晴れて日本語にも対応しました。iPadに加えてApple Pencil(またはApple Pencil互換ペン)が必要となりますが、「iPadへの入力」を一変させる素晴らしい機能ですのでぜひ活用してみてほしいと思います。 Apple Pencilで書き込むだけ スクリブルを利用するのは実に簡単です。「設定」アプリから[Apple Pencil]を開くと[スクリブル]の設定項目がありま

                                iPadの手書き文字認識機能「スクリブル」を使いこなそう - iPadパソコン化講座
                              • Windows 10に搭載されているMicrosoft OCRを使って文字認識する – RIALAB.

                                Windows 10に搭載されているMicrosoft OCRを使って文字認識する 木曜日 , 11, 3月 2021 makoto .NET, Windows, 技術的なメモ 1 Comment 文字認識が必要になりそうなお仕事で、実装方法と難しさ、文字認識の精度を調べるために作った簡易OCRツールです。 Windows 10に標準搭載されているOCR( Microsoft OCR / Windows.Media.Ocr )を使っただけなのですが、機能として面白かったのでプログラムとソースを公開します。 ※実行画面のサンプルとして、青空文庫で公開されている『吾輩は猫である』のスクリーンショットを使用しました。 ※2022/02/05 『GUI対応したPDFをページごとに画像変換(PNG/BMP/JPEG/GIF/TIFF形式)するツール [WPF]』で応用アプリケーションを掲載しました。

                                • iPadの手書き文字認識「スクリブル」、iPadOS 15の日本語対応でこんなに便利

                                  毎年秋の登場が恒例になっている「iOS」「iPadOS」のメジャーアップデート。2021年は「iOS 15」「iPadOS 15」となる。正式リリースはまだ先だが、「Apple Beta Software Program」という無料のプログラムに登録すると、端末のユーザーなら誰でも現時点のパブリックベータ版をインストールして試すことができる。 今回はiPadOS 15で対応予定の「日本語手書き文字認識」機能の使い方を詳しく紹介する。正式版で試した上で記事にするのが筆者のポリシーなのだが、日本語手書き文字認識にとても感激したため、今回は速報性を優先しベータ版を試した。 英語などの手書き文字認識は「iPadOS 14」で既に対応し、操作方法はiPadOS 15のベータ版にも引き継がれている。正式版で大きく変更されることはまずないと考えているが、それでも正式版とは異なる可能性がある点に注意してほ

                                    iPadの手書き文字認識「スクリブル」、iPadOS 15の日本語対応でこんなに便利
                                  • python:tkinterで範囲を選択し、その範囲内の文字をpyocrで文字認識 - Qiita

                                    ・画像の好きな範囲を指定して、文字認識したい。 理由 ①紙資料のデジタル化促進の手段の1つとして、知りたい 見積書とか、FAXとか紙ベースの資料は多い。(主観ですが、主に地方) ②無料で行いたい。 いきなり有料の製品を使う度胸はありませんので、まず有用性を無料で知る。 参考 Qiita記事 tkinterで画像の範囲指定する方法 https://qiita.com/hisakichi95/items/47f6d37e6f425f29c8a8 pyocr,tesseractの使い方 https://qiita.com/nabechi6011/items/3a367ca94dbd208efcc7 ・内容 1.OCRを行いたい画像を読み込む 2.その画像の中でさらに読み込みたい文字の範囲を指定する(下画像の赤枠) 3.赤枠の範囲を切り取り、新たな名前をつけて保存する 4.保存したデータを1つずつ

                                      python:tkinterで範囲を選択し、その範囲内の文字をpyocrで文字認識 - Qiita
                                    • アップル「iPadOS 15」は日本語の手書き文字認識に対応で、仕事にも勉強にも便利 (1/5)

                                      秋に正式リリースを予定する「iPadOS 15」のパブリックベータ版をテスト。Apple Pencilに関連する注目機能を試してみました アップルが、2021年の秋に正式リリースを予定する「iPadOS 15」のパブリックベータ版を公開しています。専用デジタルペンのApple Pencilによる手書き作業が、さらに便利になりそうな3つの新機能に注目しました。 iPadOS 15はパブリックベータ版も同様、2014年に発売されたiPad Air 2、2015年モデルのiPad mini 4から最新の現行iPadシリーズまで幅広く対応しています。Apple IDと対応するiPadを持っていれば、パブリックベータのソフトウェアは誰でも無料でダウンロードして試せます。 現行のiPadはすべてのモデルが第1世代、または第2世代のApple Pencilによる手書き入力に対応します。筆者は本稿でiPa

                                        アップル「iPadOS 15」は日本語の手書き文字認識に対応で、仕事にも勉強にも便利 (1/5)
                                      • 簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部

                                        D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。 ・AI OCR は Google vs Microsoft の構図。 両者精度高。 ・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。 ・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。 スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect

                                          簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部
                                        • 無料で使える「手書き文字認識AI」 ユーザーローカルが提供を開始

                                          ユーザーローカルによると「近年、業務効率改善やデータ活用のためにデジタル化を進める動きが活発になっており、そのためには文書のデジタル化が必要だ。しかし、手書き文字のOCR(光学文字認識)ではコストがかかり、デジタル化を妨げる要因となっていた」という。 くずし字や略字も認識 関連記事 無償で利用できる「数理、データサイエンス、AI」の教材を公開 東京大学 東京大学の数理・情報教育研究センターは「数理・データサイエンス・AIモデルカリキュラム」に準拠した教材の無償公開を開始した。クリエイティブ・コモンズ・ライセンス(CC BY-NC-SA)で利用できる。 「考えただけ」で文字を入力できるAIシステムを開発 脳の運動皮質に埋め込んだデバイスから得たデータをAIが解釈することで、四肢の不自由な患者がテキストでコミュニケーションできるシステムをスタンフォード大学の研究チームが開発した。 DXにはデジ

                                            無料で使える「手書き文字認識AI」 ユーザーローカルが提供を開始
                                          • ユーザーローカル、手書き文字認識AIのAPIを無償提供

                                            ユーザーローカルは28日、同社が開発した「ユーザーローカル 手書き文字認識AI」の提供を開始。APIを通じて無償で利用できるもので、Web上でマウス操作で試せるWebページを公開している。ディープラーニングを用いたAIは、ひらがな、カタカナ、常用漢字、英字、記号など、くずし字や略字にも対応する手書き文字を画像から読み取るもので、Web APIで自社システムに文字認識機能を手軽に組み込める。APIドキュメントは、Webページの資料ダウンロードから必要事項を記入・送信すると入手できる。

                                              ユーザーローカル、手書き文字認識AIのAPIを無償提供
                                            • 文字認識アルゴリズムのFOTSを実装したので,1から解説してみる(EASTも少し) - Qiita

                                              はじめに 例によって暇だったため,FOTS(Fast Oriented Text Spotting with a Unified Network)をPytorchで実装してみました.実装はこちら→https://github.com/jjjkkkjjj/pytorch.dlで,FOTS意外にも気まぐれでいろんなアルゴリズムを実装しています.今回の実装では,学ぶことも多かったので,アウトプットも含めてFOTSを1から解説してみたいと思います.また,FOTSはEAST(An Efficient and Accurate Scene Text Detector)から踏襲した部分も多いので,EASTの解説も含んでいると思います. ちなみに,以下が実装したFOTSの出力結果です.ところどころおかしいですが,いい感じですね〜. 入力画像 出力画像 FOTSとは FOTSとは,その名(Fast Orie

                                                文字認識アルゴリズムのFOTSを実装したので,1から解説してみる(EASTも少し) - Qiita
                                              • PythonとWinRT OCRで文字認識 - Qiita

                                                import cv2 img = cv2.imread('test.jpg') (await winocr.recognize_cv2(img, 'ja')).text pip install jupyterlab jupyter_http_over_ws jupyter serverextension enable --py jupyter_http_over_ws jupyter notebook --NotebookApp.allow_origin='https://colab.research.google.com' --ip=0.0.0.0 --port=8888 --NotebookApp.port_retries=0

                                                  PythonとWinRT OCRで文字認識 - Qiita
                                                • Google Keepの手書き文字認識の性能が爆上がりしている件について

                                                  とても使い勝手の良いアプリで、iOS純正のメモアプリより多用しています。 Google系のサービスをメインで使っている人だったら、これを使わない手はないのではないでしょうか? 最近は、GmailやGoogleカレンダーとの連携がスゴイのですよ。 こんな感じにサイドのボタンがありますよね。 ここで新規作成すると、メールへのショートカットが自動的に挿入されるのですよ。めっちゃ便利ですよね。 さて、今回の本題に入ります。 Google Keepに手書き文字認識なんてあったっけ?と思われる人いますよね? 公式には、ないです。偶然気がつきました。 Google Keepで新規作成すると、このようなメニューが出てきます。 ここで、「図形描画」を選択します。 そして、手書きで文字を書くのですよ。 描画なので画像になるわけなのですが、画像自体をタップして、右上の三点アイコンをタップすると、「画像のテキスト

                                                    Google Keepの手書き文字認識の性能が爆上がりしている件について
                                                  • クイックスタート: 光学式文字認識 (OCR) - Azure AI services

                                                    このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。

                                                      クイックスタート: 光学式文字認識 (OCR) - Azure AI services
                                                    • ゲーム画面の画像認識 → 文字認識 → 文字起こし の流れをリアルタイムに行う - Qiita

                                                      1. はじめに PyOCRを利用した文字認識に挑戦中のメモ書きです。 こういった場での公開は初めてなので、至らない点もあるかと思いますがよろしくお願いします。 好きなゲームの布教・翻訳を目的に作り始めたのでこんな記事タイトルをしてますが、記事の文字起こしや動画の字幕など何にでも使えると思います。 読み上げソフトに打ち込む際にちょっとだけ便利かもしれません。 2. ざっくりフロー PyAutoGuiで指定範囲のスクリーンショットを撮影 OpenCVでグレースケール、拡大 PyOCRで文字認識、テキスト出力 左上隅の座標を取得します 658,502 右下隅の座標を取得します 1196,602 【原文】 ------------------------------------ いつ頃からか出来上がった召喚という技術は、 様々な世界から技術、 人、 物を運んできたが、 この画期的な技術に少々浮かれ

                                                        ゲーム画面の画像認識 → 文字認識 → 文字起こし の流れをリアルタイムに行う - Qiita
                                                      • 図書館情報学とAIの新展開 ーAI文字認識×クラウドソーシングで史料のテキスト化を加速【第2回 人工知能学会誌コラボ】 | AI専門ニュースメディア AINOW

                                                        図書館情報学とは 図書館情報学とは、図書の収集・分類・保存・利用に関する諸問題を研究する図書館学と、情報の利用やあり方について研究する情報学とを合わせた学問領域です。 図書館にいくと膨大な数の本がきれいに整理され、決められた場所に並んでいます。このおかげで利用者の私たちは難なく本を探すことができます。 このように、図書館にある古くからの膨大な本や論文などの情報をいかに効率的に正しく収集し、保存していくのかを研究し突きつめきたのが図書館学でした。 1970年代に入るとコンピューターが広く普及し、情報検索が容易になってきました。それに伴い図書館の情報化も大きく進展し、従来の図書館学に加えてコンピューターを利用することを前提とした図書館情報学が成立しました。 図書館情報学では、知りたい情報を効率的に検索し、利用できるような環境づくりとその整備、情報の取り扱いなど、図書館に限らないあらゆる事象が研

                                                          図書館情報学とAIの新展開 ーAI文字認識×クラウドソーシングで史料のテキスト化を加速【第2回 人工知能学会誌コラボ】 | AI専門ニュースメディア AINOW
                                                        • 番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく

                                                          当連載では、漢字改良に挑んだひとりの人生をその著書を通じて書いてきたが、今回は文字自体に焦点をあてる。とりあげるのは前回に引き続きビットマップフォントだ。 前回の記事で明らかになったのは、次のような結論だ。 ビットマップフォントは何かを差し引くではなく、線を重ね合わせ、シェアすることでドットに複数の役割をもたせる。極限まで省略されているようで、実は何も省略していない。 世の中に明朝体と呼ばれる書体が複数ある。同じようにビットマップフォントもさまざまな企業からリリースされている。8ドットや9ドットのビットマップはギリギリまで削減されているように見えた。しかし、このギリギリのなかに取りうる選択肢がフォントの数だけ存在するのだろうか?それとも概ね同じ形に収斂されてゆくのだろうか? 収斂されてゆくのであれば、それが(9ドットの)究極の到達点であり興味深い。また大きな違いが生じるのであれば、簡略化の

                                                            番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく
                                                          • AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB

                                                            光学式文字認識(OCR)システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 中国の巨大テック企業BaiduのYuning Duらは今回新たに、超軽量のOCRシステムである「PP-OCR」を提案しています。

                                                              AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB
                                                            • グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化

                                                              印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleは米国時間9月1日、同社の「Cloud AI」製品群の新製品と新機能を発表した。「Contact Center AI」(CCAI)の新しい製品と機能のほか、「Document AI」の新バージョンなどがある。さらに、機械学習運用(MLOps)担当者向けに「AI Platform」を刷新したことも明らかにした。 Googleは、同社のAI(人工知能)に関する知見が「Google Cloud」の大きな強みだと考えている。「当社のAI研究に関する進歩をクラウドソリューションに生かし、より良い顧客体験を創出できるようにしている」と、Google Cloud AI&Industry Solutionsで責任者を務めるAndrew Mo

                                                                グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化
                                                              • MNISTで手書き文字認識やってみた|まーこ

                                                                お勉強記録第一弾です。 今回使用するMNISTとは、手書き数字(0~9)の画像とその画像に書かれた数字のラベルのデータセットです。AIドルの研修でも使用しましたが、DeepLearningのチュートリアルとしてよく使用されています。 今回はこのMNISTを使用し、手書き数字(0~9)の分類をするDeepLearningのモデルを構築してみようと思います。 実行環境・ライブラリのご紹介Pythonの実行環境ですが、まずはGoogle Colaboratoryを使用することをオススメします。 Jupyter Notebookの環境構築って難しくないですか?私だけですか??? 環境構築で躓いてはやる気も削がれるので、いますぐGoogleアカウント作ってサクッと始めちゃいましょう。 Colaboratoryはクラウド上で動くJupyter Notebookみたいな感じです。 使用するライブラリをイ

                                                                  MNISTで手書き文字認識やってみた|まーこ
                                                                • 【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話

                                                                    【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話
                                                                  • Python と Tesseract OCR を使って文字認識をしてみよう! - GIS奮闘記

                                                                    本日は Python と Tesseract OCR を使って文字認識をしてみようと思います。みなさんは OCR と聞いてピンときますか?実は私たちの周りは OCR を使用したテクノロジーで溢れかえっています。 OCR とは? OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術のことです。この技術を利用することによって、例えば、紙に書かれている情報を毎回パソコンで手入力しなければいけない、ということはよくあるかと思います。OCR を使うことによってこの作業を自動化することができるようになります。 最近はフリーの OCR エンジン が普及していており、プログラミング で OCR を扱うことが

                                                                      Python と Tesseract OCR を使って文字認識をしてみよう! - GIS奮闘記
                                                                    • 東芝デジタルソリューションズ、ディープラーニングで手書き文字認識精度を向上させた「AI OCR文字認識サービスV2.0」提供開始

                                                                        東芝デジタルソリューションズ、ディープラーニングで手書き文字認識精度を向上させた「AI OCR文字認識サービスV2.0」提供開始
                                                                      • Tesseract OCR 5.3.3 のインストールと動作確認(多言語の文字認識)(Windows 上)

                                                                        【要約】 Tesseract OCR 5.3.3はWindows上での多言語文字認識ソフトウェアである.公式ページからインストール手順を確認し,必要な言語データをダウンロードして適切なディレクトリにインストールする.Windowsでの日本語文書読み取りには,画像を用意しコマンドプロンプトで指定コマンドを入力し,文字認識を行う.高解像度画像を使うことで、認識の精度が向上する傾向にあるようだ.以上がTesseract OCR 5.3.3のインストールと使い方の手順である. 【関連する外部ページ】 公式ページ: https://github.com/tesseract-ocr/tessdoc 【サイト内の関連ページ】 Tesseract OCR の使い方: 別ページ »にまとめ Ubuntu での Tesseract OCR のインストール: 別ページ »で説明している. Tesseract O

                                                                        • 手書き文字認識に適さない画数の多い漢字ども【追記有】

                                                                          スマホでの文字入力に手書き認識を使っているけど、画数の多い漢字は本当クソ(KUSO)。中国式で簡略化してほしい。 🌋 例えば、「書」とか。門構えもクソ。これを書いているうちに「門」という文字がヒットして終わり。問とか間とか書けない。草書体みたいに簡略して書くと「同」がヒットする。問といえば問題の題の方もダメだ。頻繁につかう単語なのに画数が多すぎる。それが問題だ!!!!!ほかにも「響」とか・・ 🌋 手書き文字認識に適した漢字だけ残すとか・・簡略化するとか・・なんとかしてよ!!画数が多くて嬉しいのって書道家くらいちゃうんか?あとハンコヤ? 🌋 候補に旧字体とか異体字まで出すの止めてほしい。日本は敗戦のショックで「なるべく使わんでもよい文字はやめましょう」って当用漢字を決めたのに、なんだかダラダラと増やしやがって。しかも異体字まで簡単に入力できるようになって、「私の斉は斉じゃないです」とか

                                                                            手書き文字認識に適さない画数の多い漢字ども【追記有】
                                                                          • Google Cloud Vision APIのOCRを使ってPythonから文字認識する方法

                                                                            こんにちは、業務自動化ツール開発担当の吉池(@valmore_myoshi)です。 今回はGoogle Cloud Vision APIのOCRを使用して画像から文字認識する方法を解説します。さまざまな言語で扱えますが本記事ではPythonを使いたいと思います。 Cloud Vision APIの精度を試したり、使い方を学ぶときにお役立てください。 Cloud Vision APIとは? Cloud Vision APIは画像認識に特化したAPIです。画像から顔を検出したり、写っているものを識別できます。本記事ではそのなかでもOCRを使ったテキスト検出に絞って解説します。 REST APIやさまざまな言語ごとに用意されているクライアントライブラリを通してCloud Vision APIを使用できます。Cloud Vision APIでできることや精度を知りたい方は画像をアップロードするだけ

                                                                              Google Cloud Vision APIのOCRを使ってPythonから文字認識する方法
                                                                            • OCRアプリの文字認識は本当に使えるのか?字が汚い私で試してみたw

                                                                              手書きで書いたメモを簡単に読み込むことができたら、仕事がかなり効率化されますよね。もちろん印刷物も電子化すれば、分厚い書類の中から書類を探すということもなくなるので楽になるはず。また、例えば仕事で会議の議事録を取った時とか、今までの手書きのメモをデジタルで保存できるようになれば、「あのときのメモどこだったっけな?」と困らなくて済むでしょう。 そんな私も取材や仕事で上司から言われたことをメモすることが結構多いんですが、このメモを人に渡すと「なかなか読めない・・・」と言われることがしばしばありました。ってそれじゃメモの意味ないやないかーい! その字の汚さには定評があって、小学校の通知表には「字をキレイに書きましょう」といつも書かれました。そうなると苦痛だったことといえば、「ノートを提出してください」。

                                                                                OCRアプリの文字認識は本当に使えるのか?字が汚い私で試してみたw
                                                                              • Rails+Google Cloud Vision APIで文字認識を実装してみた|TechRacho by BPS株式会社

                                                                                こんにちは、BPSの福岡拠点として一緒にお仕事させて頂いてます、株式会社ウイングドアの坂本です。 日頃よくお客様から「OCR(光学的文字認識)をつかって画像から文字を抽出して〜(うんぬんかんぬん)」 という要望を頂きます。 以前は少しハードルが高く感じていましたが最近はいくつかのサービスでOCRのAPIを提供されており、 大分手を出しやすくなったのではないでしょうか? 先日、RailsでそのGoogle CloudのVision APIを利用した検証用デモを作成しました。 意外とRubyの記事は少なかったため少しでも役に立てばと実装例と使ってみた所感をご紹介したいと思います。 前提 デモ作成の目的はOCRで以下の要件が満たせそうか検証すること。 そのため以下の要件を意識しながらデモを作成しています。 日本語を含む手書きの表を読み取れること(今回はシフト表を想定) 表の中身の項目は複数ある文

                                                                                  Rails+Google Cloud Vision APIで文字認識を実装してみた|TechRacho by BPS株式会社
                                                                                • ニューラルネットワークをガラス板で実装し電源なしで動作する手書き文字認識装置 | スラド ハードウェア

                                                                                  90曰く、 ニューラルネットワークを使った手書き文字認識システムを、ガラスを使って実装する試みがHACKADAYで紹介されている。ガラス板に入力される光を使い、電力なしに動作するという。 穴をあけるなどして特別に細工された薄板に、光強度の組として量子化された画像を入力すると、その光が読み取り部に集中して推論結果を示す。物理的には静的なガラス板で電源は不要だが、手書き数字データセットのMNISTを使った実験結果では入力画像1000点に対し精度は79%と低め。