並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 27 件 / 27件

新着順 人気順

文字認識の検索結果1 - 27 件 / 27件

  • 源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

      源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai
    • AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch

        AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch
      • グーグルレンズの「パソコンにコピー」が地味に便利だという話 - 世界のねじを巻くブログ

        Google Lensでテキストをスキャン いきなりですが、グーグルクローム関連の小ネタを3つ紹介。 Google Lensでテキストをスキャン 二窓検索機能 タブ検索 まず一つ目は、 現実世界にある文字・テキストを スマホのGoogle Lensのアプリで読み取り文字起こしして、 PCのGoogle Chromeに飛ばすというライフハック。 パソコンで作業してるときけっこう使えます。 まずはグーグルレンズで文字を読み込み、 場所・範囲を選択。 そして 上記画像の下部に「パソコンにコピー」ってあるのわかりますかね?? これをタップすれば、Google Chromeにコピーされ、 あとは PC上でCtrl+V コピペできるようになります。 例として上記画像の、サンタナのアルバム『キャラバンサライ』ライナーノーツから。 肉体は溶けて宇宙に変わる 宇宙は溶けて静寂の音に変わる 音は溶けてまばゆい

          グーグルレンズの「パソコンにコピー」が地味に便利だという話 - 世界のねじを巻くブログ
        • LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発

          紙の書類をスマホで撮影して「LINE」で送ると、約3秒でテキスト化して返信するAIアプリが登場。開発元は、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」。ユーザーがOCRソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 紙の書類をスマートフォンのカメラで撮影し、「LINE」で画像を送ると、約3秒でテキスト化して返信する――。こんなAIアプリを、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」が7月3日からLINE上で公開している。ユーザーがOCR(光学文字認識)ソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 記者が試しに名刺を撮影して公式アカウントに送ったところ、すぐに氏名や企業名、所属部署、オフィスの住所、電話番号、メールアドレスなどを正確にテキスト化して返信してくれた。 このアプリの名前は「文字起こし ばりぐっ

            LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発
          • 「Google Chrome」デスクトップ版で画像のテキストを認識・翻訳可能に ~「Google レンズ」を搭載/検索結果はサイドパネルに、ちょっとした調べもので気軽に使える

              「Google Chrome」デスクトップ版で画像のテキストを認識・翻訳可能に ~「Google レンズ」を搭載/検索結果はサイドパネルに、ちょっとした調べもので気軽に使える
            • WindowsのPythonでデスクトップ通知(トースト)作ってみた【WinRT】 - Qiita

              from win11toast import toast toast('Hello Python', 'Click to open url', on_click='https://www.python.org') from win11toast import toast toast('Hello', 'Lorem ipsum dolor sit amet, consectetur adipisicing elit. Earum accusantium porro numquam aspernatur voluptates cum, odio in, animi nihil cupiditate molestias laborum. Consequatur exercitationem modi vitae. In voluptates quia obcaecati!')

                WindowsのPythonでデスクトップ通知(トースト)作ってみた【WinRT】 - Qiita
              • 崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」

                刀箱師 | 中村圭佑 | 展示ケース作家 | 刀とくらす。 @katana_case_shi 「わけのほる 麓の道はおほけれど おなじ高ねの 月をこそみれ」 どうやら「わけのほる」という一休宗純の和歌のようで、以下のサイトを見ると解説がありました。 当時この鐔を付けて戦った武士はこの和歌にどのような想いを重ねたのだろうか。 575.jpn.org/article/174793… pic.twitter.com/dSIJbpS4OB 2022-12-22 23:40:23

                  崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」
                • Tesseract.js | Pure Javascript OCR for 100 Languages!

                  Tesseract.js is a pure Javascript port of the popular Tesseract OCR engine. This library supports more than 100 languages, automatic text orientation and script detection, a simple interface for reading paragraph, word, and character bounding boxes. Tesseract.js can run either in a browser and on a server with NodeJS. Check out the Example code and API docs on GitHub.

                  • 日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策

                    2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深堀りを、2日目は「Production」をテーマに、Web開発技術やUI/UX、プロジェクトマネジメントなど、より実践的な内容についてたくさんのプレゼンテーションが行われました。「NAVER ClovaのOCR(光学的文字認識) 」に登壇したのはNAVER OCR Team AI ResearcherのHwalsuk Lee氏。深層学習を用いたOCR技術の仕組みについて語りました。講演資料はこちら LINEのOCR技術の仕組み Hwalsuk Lee氏:みなさま、こんにちは。Hwalsuk Leeと申します。NAVER Clova OCR Teamから参りました。今

                      日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策
                    • Google Lensアプリ、手書き文字をデータ化してPCに転送する新機能

                      米Googleは5月7日(現地時間)、モバイルアプリ「Google Lens」の複数の新機能を発表した。日本語版でも既に使えるようになっている。 Google Lensは2017年公開の、AI採用による画像情報検索機能。AndroidおよびiOSアプリが公開されている他、Pixelシリーズの「カメラ」アプリにも搭載されている。 手書き文字をコピーし、PCにテキストデータとして転送 手書き文字をコピーする機能は既にあるが、これをさらに、同じGoogleアカウントでログインしているChromeブラウザを起動中のPCに転送できるようになった(カメラアプリ内のLensではできない)。 Lensアプリを起動してコピーしたい手書きテキストを写し、文字ボタン(左から2番目のボタン)をタップしてコピーしたい範囲を指定すると、「パソコンにコピー」ボタンが表示されるので、これをタップすると、同じWi-Fiネッ

                        Google Lensアプリ、手書き文字をデータ化してPCに転送する新機能
                      • 凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発

                        2022/11/11 凸版印刷、明治期から昭和初期の手書き文字を解読する AI-OCRを日本で初めて開発

                          凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発
                        • AIで“くずし字”の解読に挑む | NHKニュース

                          日本で古くから使われてきた手書きの文字「くずし字」を、AI=人工知能を使って瞬時に今の文字に置き換えるシステムの開発を競う国際コンペが行われ、およそ300チームがより精度の高い解読に挑みました。 「くずし字」は平安時代から明治時代の初めごろまで広く使われていましたが、今の文字と形が大きく異なっていたり複数の文字が連続して書かれたりしていることから、正確に解読できる人には限りがあります。 このため「人文学オープンデータ共同利用センター」などは、AIを使ってくずし字を瞬時に今の文字に置き換えるシステムを開発し、そのうえで新たな発想を加えてさらに精度を高めようと国際コンペを行いました。 コンペでは、センターのシステムをもとに新たな手法を開発することで、数千枚の画像に書かれたくずし字をどれだけ正確に認識できるかが競われ、国内外の企業や研究者などおよそ300チームが参加しました。

                            AIで“くずし字”の解読に挑む | NHKニュース
                          • iOS 15ではLive Text機能により、カメラで撮影した写真内の文章や住所、電話番号、メールアドレスを利用してテキスト入力ができる「Text from Camera」機能が利用可能に。

                            iOS 15ではLive Text機能によりカメラで撮影した写真内の文字を利用してテキスト入力ができる「Text from Camera」機能が利用できるそうです。詳細は以下から。 Appleは日本時間2021年06月、完全オンラインで開催したWWDC21の基調講演で、次期iPhone用OS「iOS 15」を発表し、この中で「Live Text」という写真内にある文字や文章を検出し、編集可能なテキストとしてコピー&ペーストできる機能がiOS 15/iPadOS 15、macOS 12 Montereyで利用可能になると発表しましたが、 Live Text in photos Text is now completely interactive in all your photos, so you can use functions like copy and paste, lookup,

                              iOS 15ではLive Text機能により、カメラで撮影した写真内の文章や住所、電話番号、メールアドレスを利用してテキスト入力ができる「Text from Camera」機能が利用可能に。
                            • macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。

                              macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能になるそうです。詳細は以下から。 Appleは現地時間2021年06月07日に完全オンラインで開催したWWDC21の基調講演の中で、macOS 12 MontereyやiOS/iPadOS 15の新機能として「Live Text」という写真内にあるテキストを検出し、編集可能なテキストとしてコピー&ペーストできる機能を発表しました。 Live Text in photos Live Text intelligently unlocks rich and useful information in images, so you can make a call, send an email, or look up directions w

                                macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。
                              • iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ

                                「iOS 15」および「iPadOS 15」に搭載される「テキストの認識表示(Live Text)」機能。 写真の中にある文字部分をタップすることで、テキストとして認識し、電話をかけたり、Eメールを送ったり、(A12 Bionic以降であれば)道順を調べることも可能になります。 iOS 15:テキストの認識表示 その方法としては、 写真をアプリを開く レストランのメニューや商品のタグなど、文字が写っている写真を探す 文字が小さく表示されている場合は、ピンチ操作で写真を拡大するなど調整 文字部分を長押しすることで選択ツールが出現。選択ツールの端をドラッグして、コピーしたい文字をハイライト 画面から指を離し、ポップアップメニューから「コピー」や「翻訳」を選択 メモなどを開き、ペーストする これで写真にあるテキストを活用できるようになります。 下の写真はメモアプリに認識したテキストをコピペしたと

                                  iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ
                                • PythonとTesseract OCRで文字認識 - Qiita

                                  概要 Pythonの勉強をしている時に良い題材がないかを調べている際、文字認識について興味があったので一緒に使って勉強しようと思いました。 オープンソースで使用可能なOCRはTesseract OCRが優秀だということでこちらを使ってみたいと思います。 Tesseract OCRのインストール 今回はTesseract OCR4.0以降を使用します。 ダウンロード 公式ページ https://github.com/tesseract-ocr/tesseract windowsの場合 自力でコンパイルしても良いが、Windows用インストーラが用意されているのでそちらを実行してインストールを行う。 wikiの「Windows」項目内の「Tesseract at UB Mannheim」をクリック 遷移先のページの32bitもしくは64bitのどちらかをダウンロード。 古いバージョンが欲しい場

                                    PythonとTesseract OCRで文字認識 - Qiita
                                  • Paper Website: Start a tiny blog from your journal

                                    A new way to build websites using pen & paper. Write more content with less distractions.

                                      Paper Website: Start a tiny blog from your journal
                                    • iOS 17/iPadOS 17ではテキスト認識表示機能がアップデートされ、日本語と韓国語, 中国語で縦書きテキストのコピー&ペーストが可能に。

                                      iOS 17/iPadOS 17ではテキスト認識表示機能がアップデートされ、日本語と韓国語, 中国語で縦書きテキストのコピー&ペーストが可能になっています。詳細は以下から。 Appleは2021年にリリースした「iOS 15/iPadOS 15」で写真内にあるテキストを抽出し、コピー&ペースト(OCR)できるようにする「テキスト認識表示 (Live Text)」を英語などでサポートし、2022年リリースされた「iOS 16/iPadOS 16」では日本語と韓国語のテキスト認識も追加サポートされましたが、 本日リリースされたiOS 17/iPadOS 17では、テキスト認識表示機能がアップデートされ、日本語と韓国語、中国語(CJK)の縦書きテキストの認識も可能になっています。 Vertical text recognition. Live Text recognizes vertically

                                        iOS 17/iPadOS 17ではテキスト認識表示機能がアップデートされ、日本語と韓国語, 中国語で縦書きテキストのコピー&ペーストが可能に。
                                      • iOS16:画像のテキスト認識表示が日本語に対応 - こぼねみ

                                        「iOS 16」「iPadOS 16」にて、画像のテキスト認識表示((Live Text)が、ようやく日本語にも対応します。 新たに日本語や韓国語など9カ国語の自動検出がサポートされます。 また、写真だけでなく一時停止したビデオからもテキストやQRコードを認識可能になります。 iOS16:画像のテキスト認識表示が日本語に対応詳細は、WWDCのセッション「Platforms State of the Union」からどうぞ(ビデオの最後の方、1時間5分あたりです)。 via Macお宝鑑定団 blog(羅針盤) 新しいiPhoneやiPod touchの情報は新型iPhoneの噂カテゴリーにまとめてあります。 新しいiPadに関する情報は新型iPadの噂カテゴリーにまとめてあります。 新型Macを含むMac全般の情報はMacカテゴリーに、iMacの情報はiMacカテゴリーに、MacBook

                                          iOS16:画像のテキスト認識表示が日本語に対応 - こぼねみ
                                        • iOS15の新機能で学生が他人のノートを丸写しする動画が「天才的」と話題 - iPhone Mania

                                          iOS15の新機能「テキスト認識表示」を使って、授業中に他の学生がPCでとったノートを、iPhoneを使って丸ごとコピーしてしまう様子の動画が話題になっています。 ノートを取っているPCの画面を撮影しテキスト認識 iOS15では、写真にある文字をテキスト認識してコピー&ペーストや翻訳に使える「テキスト認識表示」機能が利用できるようになっています。 フリーランスUXライターのjuan氏(@juanbuis)が「学生たちが、iOS15を使ってお互いのノートを盗みあっている…天才的だ」とコメントを添えて動画をTwitterに投稿しています。 大学の授業中に撮影したと思われる動画には、ノートを取っている学生の斜め後ろから、iPhoneでPCの画面を撮影し、テキスト認識した文字をコピーすることで他人のノートを丸写ししている様子が映っています。 students are starting to ste

                                            iOS15の新機能で学生が他人のノートを丸写しする動画が「天才的」と話題 - iPhone Mania
                                          • GitHub - naiveHobo/InvoiceNet: Deep neural network to extract intelligent information from invoice documents.

                                            Deep neural network to extract intelligent information from invoice documents. TL;DR An easy to use UI to view PDF/JPG/PNG invoices and extract information. Train custom models using the Trainer UI on your own dataset. Add or remove invoice fields as per your convenience. Save the extracted information into your system with the click of a button. ⭐ We appreciate your star, it helps! The InvoiceNet

                                              GitHub - naiveHobo/InvoiceNet: Deep neural network to extract intelligent information from invoice documents.
                                            • iOS 16では「テキスト認識表示(Live Text)」が日本語と韓国語の自動検出をサポート。

                                              iOS 16では「テキスト認識表示(Live Text)」が日本語と韓国語の自動検出をサポートするそうです。詳細は以下から。 Appleは日本時間2022年06月07日午前02時から、世界開発者会議(WWDC22)をオンラインで開催していますが、基調講演に続いて開催されている「Platforms State of the Union」によると、iOS 16ではテキスト認識表示(Live Text)が日本語と韓国語でも可能になるそうです。 テキスト認識表示は、機械学習(Neural Engine)を利用し、オンデバイスで写真内にある文字や文章を検出、編集可能なテキストとしてコピー&ペーストできる機能で、iOS 15では英語と中国語(簡体字と繁体字)、フランス、イタリア、ドイツ、スペイン、ポルトガル語の計7言語がサポートされていましたが、 iOS 16では上記の7言語に加え、日本語と韓国語の認

                                                iOS 16では「テキスト認識表示(Live Text)」が日本語と韓国語の自動検出をサポート。
                                              • macOS 13 VenturaやiOS 16のテキスト認識表示機能は、日本語と韓国語に加えウクライナ語もサポート。

                                                初期リリース(macOS 12/iOS 15)段階では、このテキスト認識表示で識別可能な言語は、英語と中国語、フランス、イタリア、ドイツ、スペイン、ポルトガル語の計7言語で、WWDC22では次期macOS 13 VenturaやiOS 16で動画内のテキスト認識(Live Text in videos)と日本語と韓国語が追加サポートされ、合計9言語でテキスト認識表示機能が利用可能になる発表されましたが、 AppleのmacOS 13 VenturaやiOS 16/iPadOS 16のプレビューページによると、macOS 13/iOS 16では、日本語と韓国語に加え、ウクライナ語(Ukrainian)のテキストでもテキスト認識表示機能が利用可能になるそうです。 6.A12 Bionic以降を搭載したiPhoneで利用できます。英語、中国語、フランス語、イタリア語、ドイツ語、日本語、韓国語、ポ

                                                  macOS 13 VenturaやiOS 16のテキスト認識表示機能は、日本語と韓国語に加えウクライナ語もサポート。
                                                • macOS 14 SonomaやiOS 17では文字入力した文章をKyokoなどの合成音声で読み上げてくれる「ライブスピーチ」機能が利用可能に。

                                                  macOS 14 SonomaやiOS 17ではKyokoなどの合成音声を利用し文字入力した文章を読み上げてくれる「ライブスピーチ」機能が利用可能になっています。詳細は以下から。 Appleは2022年09月にリリースした「iOS 16」と「watchOS 9」で、アクセシビリティ機能の1つとしてiPhoneにペアリングされたApple WatchをiPhoneから操作できる「Apple Watchミラーリング」機能を追加しましたが、 2023年09月にリリースされた「iOS 17/iPadOS 17」や「macOS 14 Sonoma」では、同じくアクセシビリティ機能の1つとして新たに合成音声を利用し文字入力した文章を読み上げてくれる「ライブスピーチ (Live Speech)」機能が利用できるようになっています。 ライブスピーチ ライブスピーチ機能はmacOS 14 Sonomaまたは

                                                    macOS 14 SonomaやiOS 17では文字入力した文章をKyokoなどの合成音声で読み上げてくれる「ライブスピーチ」機能が利用可能に。
                                                  • 【iOS15】テキスト認識表示(Live Text)を日本語環境で利用する方法 - iPhone Mania

                                                    iOS15の新機能テキスト認識表示とは、iPhoneのカメラで写した画像に含まれるテキストを自動認識し、コピーして共有したり、翻訳を行ったりすることができる機能です。 「テキスト認識表示」機能を使用するにはiOS15を搭載したiPhone XR、iPhone XS以降が必要です。現時点で言語は、英語、中国語、フランス語、イタリア語、ドイツ語、ポルトガル語、スペイン語に限られています。 カメラで撮影された日本語のテキストは認識できませんが、日本語環境でもテキスト認識表示を有効にすると7つの言語をテキスト認識表示することができます。

                                                      【iOS15】テキスト認識表示(Live Text)を日本語環境で利用する方法 - iPhone Mania
                                                    • [てっぱんアプリ!] くずし字を読めるようにする「みを」。達筆な手紙にも使えるかも?

                                                        [てっぱんアプリ!] くずし字を読めるようにする「みを」。達筆な手紙にも使えるかも?
                                                      • 【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania

                                                        iOS15の新機能「テキストの認識表示」は、iPhoneのカメラで捉えた画像に含まれる文字を自動認識し、コピー&ペーストや検索に利用できます。残念ながら日本語に非対応ですが、iOS15のパブリックベータ3でどこまで使えるか、試してみました。 日本語非対応の「テキストの認識表示」 iOS15では、写真の中のテキストをコピー&ペーストや検索、翻訳できる「テキストの認識表示」(英語ではLive Text)機能が、A12 Bionic以降を搭載したiPhoneで利用可能になります。 Appleの発表では、「テキストの認識表示」が利用できる言語は英語、中国語、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語の7言語で、残念ながら日本語は対応言語に含まれていません。 使えればとても便利そうな機能だけに、日本語に非対応なのは残念です。一部だけでも活用することはできないかと考え、日本語版のiOS

                                                          【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania
                                                        1