並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 584件

新着順 人気順

文字認識の検索結果121 - 160 件 / 584件

  • 画面上の文字列をOCRで読み取り翻訳できる翻訳支援ツール「PCOT」

    日本語表示に非対応のゲームをプレイするとき、簡単なコマンド名や英単語であればなんとなくニュアンスをつかんだり、辞書を使って調べたりすることができますが、長いフレーズや文章単位になってくるとなかなか大変です。「PCOT」は、ゲーム画面をOCR(光学文字認識)で読み取ってくれるので、コピペできない文章でも翻訳してくれます。 ヌルポインターストライク http://www.gc-net.jp/s_54/ 「PCOT」は「ProcessConnectOcrTranslator」の略だとのこと。公式サイトの「『PCOT』のダウンロードはこちら →」の右にある「DL」をクリック。 OneDriveのページが開き、「PCOT.ZIP」が選択された状態になっていて、ちょっと待つとファイル保存ダイアログが開くので、「ファイルを保存する」にチェックを入れて「OK」をクリック。自動でダウンロードされない場合はP

      画面上の文字列をOCRで読み取り翻訳できる翻訳支援ツール「PCOT」
    • ラズパイとAI-OCRで生産日報を電子化する(後編)

      今回は、前回に引き続き、小型ボードコンピュータの「Raspberry Pi(ラズベリーパイ、略してラズパイ)」と、機械学習などのAI(人工知能)技術を活用したOCR(光学的文字認識)である「AI-OCR」を組み合わせた事例として「生産日報の電子化」をどのように実現するかについて具体的に解説します。 ⇒連載「ラズパイで製造業のお手軽IoT活用」バックナンバー 生産日報の電子化は、以下の手順で進めます。 手書きで日報を記入する 手書き日報をラズパイで読み取り、テキストデータに変換する テキストデータに変換した日報データを現場画面に表示して内容の確認をする。誤認識している部分は手で修正する 修正した箇所を機械学習して認識率を向上させる 前回は1.と2.について説明しました。今回は3.と4.について解説します。 3.テキストデータに変換した日報データを現場画面に表示して内容の確認をする OCRは1

        ラズパイとAI-OCRで生産日報を電子化する(後編)
      • 【追加有】誰でも利用できる臨時休校期間限定【無料教材】~「学研」「まなびwith」「進研ゼミ」などから提供 - 知らなかった!日記

        新型コロナウィルスによる休校期間限定【無料学習サポートサービス】が多数でている 学研の無料教材 ニューコース学習システム・ニューワイド学習百科事典 「やさしくまるごと小学」シリーズ授業動画 「ひとつひとつわかりやすく」授業動画 学研プライムゼミ 電子書籍サービス 学研の英語付絵本アプリ(追加1) 学研の「あなたの時間割表」(追加2) まなびwithの無料教材 受講会員でなくても全学年分OK ワークブック(総復習の3月号)をダウンロードできる ワークブック(3月号以外)を1冊郵送してくれる 会員だけのサービス 「てっていはんぷく!計算プリント」 「おたのしみ!作文プリント」 「名探偵コナンの10才までに覚えたい難しいことば1000」 算数特化のAI型教材「withQubena」(追記しました) 進研ゼミの無料教材 電子図書館まなびライブラリーは期間限定で会員以外も! 無料教材を会員以外も郵送

          【追加有】誰でも利用できる臨時休校期間限定【無料教材】~「学研」「まなびwith」「進研ゼミ」などから提供 - 知らなかった!日記
        • 20万円で社員1人分の活躍、りそなHDが導入したアーム型「中継ぎロボ」の実力

          りそなホールディングス(HD)は2019年6月から小型ロボットとRPA(ロボティック・プロセス・オートメーション)などを組み合わせた新システムを導入し、現場の各種帳票にまつわる入出力作業の省人化に取り組んでいる。実証実験ではなく、既に東京都や大阪府などの施設内で50セットほどが本稼働している。 「1セットのハード費用はロボットを含めて約20万円。1セットに1人分の仕事を任せているため、約1カ月で投資回収できた」。同社の荒木敏郎デジタル化推進部AI・RPA推進チームグループリーダーは満足げだ。 新システムが担う作業は帳票に関する一連の業務だ。具体的には、OCR(光学文字認識)ソフトで読み取ったり直接送られてきたりした紙の伝票のテキストデータなどをRPAのソフトロボットで加工する。次にキーボード・エミュレーター・ソフトがそのデータを勘定系システムに入力する。 勘定系システムが入力内容を現場のプ

            20万円で社員1人分の活躍、りそなHDが導入したアーム型「中継ぎロボ」の実力
          • 画像の中の文字を見つけるのって今どんな感じなの?まとめてみたんご - Qiita

            AdventCalender論文2日目担当のCurryです! 今回は画像の中の文字を見つける技術の昔と最新をまとめました。 意外と文字検出の論文紹介ってないんじゃね!?っていう 画像は参照サイト(各章の先頭のURL)、論文中から引っ張ってきてます 文字検出 画像の中の文字を見つけるのは 文字検出 と呼ばれます。英語では Text Detection とか Text Localization という。 つまりこんなタスク。オレンジ線が文字を囲めてるので、検出ができたと判断できる。 入力画像 出力 文字検出の難しさは、以下のようによく言われる。(いわゆる論文のイントロの謳い文句) 1. 文字の多様性 2. 文字の色 3. 文字のコントラストや背景との混同 4. 文字の大きさが違う 5. 文字の方向(いわゆるアルファベットが斜めになっていたり) ちなみに、、、 文字認識 は文字を判別することなの

              画像の中の文字を見つけるのって今どんな感じなの?まとめてみたんご - Qiita
            • Pythonデータサイエンスハンドブック 第2版

              Pythonのデータサイエンス用のツールを使いこなすための実用的な情報が詰め込まれたリファレンスの待望の改訂版です。IPythonとJupyter、NumPy、pandas、Matplotlib、scikit-learnを利用し、データの操作、可視化、行列計算、時系列解析、統計分析、機械学習、データモデルの構築、複雑な科学計算まで、幅広いトピックをカバー。それぞれのトピックについて、押さえておくべき基本、tips、便利なコマンドなどを紹介します。Pythonでデータ処理を行う人にとってはいつも手元に置いておきたい「使える」一冊です。 『Python Data Science Handbook, Second Edition』への称賛 訳者まえがき はじめに Ⅰ部 Jupyter:Pythonより優れたPython 1章 IPython、Jupyter入門 1.1 IPythonシェルの起動

                Pythonデータサイエンスハンドブック 第2版
              • 現場主導のDXを実現。5万円から始められるAIカメラの実力

                製造業をはじめとするさまざまな企業のAIカメラへの期待は大きい。その一方で、導入がなかなか進まないという現実もある。ソラコムの「S+ Camera Basic」は、5万円と安価であるだけでなく、「現場へのカメラの取り付け」「通信環境」「リモートアクセス」というAIカメラ導入の3つの課題を解決できるとともに、無料で体験できる「トライアル」機能も提供している。 IoT(モノのインターネット)とAI(人工知能)の組み合わせにより、製造現場の情報をデジタル化し、人が目視で行う確認作業をデジタル化して代替することができる。中でもカメラは、人の代わりに対象を認識したり、モノの数をカウントしたり、情報を読み取ったり(OCR:光学的文字認識)、対象の状態を判断したりと、画像データを通じて、初めてのAI活用の際に導入しやすいデバイスだ。 ソラコムは、同社が通信プラットフォーム提供で培ったノウハウを生かし、セ

                  現場主導のDXを実現。5万円から始められるAIカメラの実力
                • 【AI】Deep Metric Learning - Qiita

                  はじめに 機械学習の分野でDeep Learningがその地位を揺るがぬものにして久しくなりました。 今回はその性能と汎用性の高さから、様々な分野で応用が進んでいるDeep Metric Learningについて、簡単なまとめといくつかのデモを紹介していきたいと思います。 手書き文字認識と、手書き文字認識だけでは面白くないので異常検知もやります。 Deep Metric Learning Metric Learningとは「距離学習」と言われる手法で、入力データの特徴量空間から、データの類似度を反映した特徴量空間への変換(写像)を学習する手法です。 一言で言うと、 同じクラスに属するデータは近く 異なるクラスに属するデータは遠く なるような特徴量空間への変換を学習します。 クラス分類などにおいて、距離が近すぎて分類が困難なケースでも、同じクラスは距離が近く、違うクラスは距離が遠く」なるよう

                    【AI】Deep Metric Learning - Qiita
                  • iOS 15ではLive Text機能により、カメラで撮影した写真内の文章や住所、電話番号、メールアドレスを利用してテキスト入力ができる「Text from Camera」機能が利用可能に。

                    iOS 15ではLive Text機能によりカメラで撮影した写真内の文字を利用してテキスト入力ができる「Text from Camera」機能が利用できるそうです。詳細は以下から。 Appleは日本時間2021年06月、完全オンラインで開催したWWDC21の基調講演で、次期iPhone用OS「iOS 15」を発表し、この中で「Live Text」という写真内にある文字や文章を検出し、編集可能なテキストとしてコピー&ペーストできる機能がiOS 15/iPadOS 15、macOS 12 Montereyで利用可能になると発表しましたが、 Live Text in photos Text is now completely interactive in all your photos, so you can use functions like copy and paste, lookup,

                      iOS 15ではLive Text機能により、カメラで撮影した写真内の文章や住所、電話番号、メールアドレスを利用してテキスト入力ができる「Text from Camera」機能が利用可能に。
                    • LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了

                      LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了この度開発したOCRモデルは国立国会図書館の文字認識性能評価において、96%の項目で目標値を上回る結果に LINE株式会社 AIカンパニー(本社:東京都新宿区、カンパニーCEO:砂金 信一郎)は、国立国会図書館(東京都千代田区)が保有するデジタル化資料247万点、2億2300万画像を対象とした「デジタル化資料のOCRテキスト化」作業を受託し、同プロジェクトにおいて、「CLOVA OCR」の技術によるモデル開発を実施、全文のテキストデータ化が完了しましたことを、お知らせいたします。 「CLOVA OCR」は、書類・画像に記載された文字等の情報をテキストデータへ変換するサービスです。 OCRモデルの研究・開発経験豊富なチームが、日々ユーザーニーズに寄り添いながら製品改善を

                        LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了
                      • 人間の脳が学習で使うエネルギーはシステムの1,000分の1 アルファベット会長が語る、「AI時代」の人間の競争力

                        「データを活用した未来の組織」をテーマとしたビジネスカンファレンス「Sansan Evolution Week 2023」に、Google LLCの親会社であるAlphabet Inc.の現会長 ジョン・ヘネシー氏が登壇。「ビジネスの核心に切り込むデータドリブン経営とは」と題して、AI領域で驚異的なブレイクスルーが起きた理由や、システムを「大量のデータ」で訓練することによる効果などを語りました。 ITの歴史上最も重要な出来事 ジョン・ヘネシー氏:ここからはAIのディープラーニングの革命について、全体像をお話しします。これはITの歴史上最も重要な出来事であり、トランジスタの発明やデジタルコンピューターによる変革以来となるものです。この2つから世界の産業全体が生まれたのですが、ディープラーニングはそれに匹敵する技術です。 この技術の応用範囲は飛躍的な広がりを見せています。AlphaGoが囲碁チ

                          人間の脳が学習で使うエネルギーはシステムの1,000分の1 アルファベット会長が語る、「AI時代」の人間の競争力
                        • 第602回 2020年になったのでテキストに半角スペースで暗号文を埋め込もう | gihyo.jp

                          2020年が始まりました。「⁠2020」という数字列を見ると何か見えてきませんか。そう、半角スペースですね。そこで今回は2020年にちなんで、テキストファイルに半角スペースを用いて暗号文を埋め込む方法を紹介しましょう。 テキストファイルにメッセージを埋め込める「stegsnow」 半角スペースはASCIIコードで「0x20」となります[1]⁠。UTF-8な文化圏で生活している一般的なユーザーであれば、適当なファイルやストレージをバイナリダンプした際に、適度な間隔で「0x20」が登場するデータを見ることで「ここはなんか英文っぽいな」と判断することがよくあるでしょう[2]⁠。hdコマンドやhexdumpコマンドを使う場合はASCIIの印字可能な文字もセットでダンプするので、英文ぐらいなら一発でわかるのですが、そういうことができないケースもあるのです。 結果として「0x20」もしくはプレフィック

                            第602回 2020年になったのでテキストに半角スペースで暗号文を埋め込もう | gihyo.jp
                          • 文章だけでなく視覚的なコンテンツも理解してIQクイズに答えられるAI「Kosmos-1」をMicrosoftが発表、汎用人工知能の開発に前進

                            近年では画像生成や人間との対話などの特定分野で優れた能力を発揮するAIが注目を集めていますが、一部のAI開発者は人間のように言語や視覚、聴覚などさまざまな情報をまとめて処理できる「Artificial General Intelligence(AGI)/汎用(はんよう)人工知能」の開発を目標としています。新たにMicrosoftが、言語処理だけでなく画像や視覚的なコンテンツの認識にも優れ、図形を用いたIQテストにも回答できるマルチモーダルなAI「Kosmos-1」を発表しました。 [2302.14045] Language Is Not All You Need: Aligning Perception with Language Models https://doi.org/10.48550/arXiv.2302.14045 Microsoft introduces Kosmos-1,

                              文章だけでなく視覚的なコンテンツも理解してIQクイズに答えられるAI「Kosmos-1」をMicrosoftが発表、汎用人工知能の開発に前進
                            • iOSで文字認識(Text Recognition)

                              iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 そこで今まではTesseract[2]というオープンソースのOCRエンジンや、SwiftOCR[3]という(おそらく個人がメンテしている)OSSしか選択肢がなかったのですが、つ

                                iOSで文字認識(Text Recognition)
                              • AI-OCRで国立国会図書館の資料をテキスト化 約1300万文字のデータセットから開発 その舞台裏に迫る

                                明治期以降の書籍や雑誌といった「近代活字資料」のテキストデータを生成するために、AIを活用したOCR(光学的文字認識)を新たに開発する――こんな取り組みを国立国会図書館(NDL)が発表した。OCRはデジタル画像を解析し、画像内の文字をテキストデータに変換する技術だ。近代活字資料は書体が現代とは異なるうえ、旧字旧仮名遣いが中心なのでテキストデータ化は容易ではない。 国立国会図書館からの委託を受けてこの試みに挑戦したのが、AIを使った画像処理技術を開発しているモルフォAIソリューションズ(千代田区)だ。「かなり大変な開発作業になると感じました。しかしAIなら可能かもしれない、実現できれば国立国会図書館ユーザーの利便性を高められると確信していました」――こんな声がAI-OCR開発に携わったメンバーの口から出た。 そこで開発の舞台裏について、モルフォAIソリューションズのエンジニアたちを取材した。

                                  AI-OCRで国立国会図書館の資料をテキスト化 約1300万文字のデータセットから開発 その舞台裏に迫る
                                • 目指すはAIアプリ版の“App Store”、時価総額1500億円「AI inside」急成長の理由

                                  大学在学中&休学中に複数のIT系スタートアップでのインターンやベンチャーキャピタルでのリサーチバイトを経験後、フリーランスとして独立。現在は「TechCrunch Japan」などでスタートアップ企業のプロダクトや資金調達を中心としたインタビュー・執筆活動を行っている。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 「世の中の至る所にAIを入れていきたいんです。AIは人間の役に立つものだと考え

                                    目指すはAIアプリ版の“App Store”、時価総額1500億円「AI inside」急成長の理由
                                  • 2021年出版関連の動向予想 | HON.jp News Blog

                                    《この記事は約 23 分で読めます(1分で600字計算)》 新年あけましておめでとうございます。 2021年も HON.jp News Blog をどうぞよろしくお願いいたします。 毎年恒例、編集長 鷹野凌による出版関連の動向予想です。 2020年の予想と検証 2020年正月の予想は、以下の5つでした。自己採点の結果を右端に付けておきます。 出版社系ウェブメディアの逆襲 → ○ 書き手争奪競争の激化 → ○ マンガの輸出入がより活発に → ○ 児童生徒向けの電書供給が本格化 → △ 音声コンテンツ市場の拡大 → ○ コロナ禍という想定外の事態が起こったわりに、おおむね予想通りでした。いつも先読みし過ぎているので、むしろコロナ禍を受け世の中の変化が加速したことにより、正答率が上がったのかもしれません。唯一「△」を付けた「児童生徒向けの電書供給」は、2020年の時点で「本格化」まではちょっと言

                                      2021年出版関連の動向予想 | HON.jp News Blog
                                    • Windows11でSnippingToolから簡単にテキスト抽出(OCR)する方法

                                      ↓コピー後のテキスト 毎日を、もっ とシンプルに ゲーム、学習、ビジネスの経営、家事。何で あれ、Windows 11がすべてをこなすお手伝 いをします。あらゆる働き方、学び方、遊び 方に合わせて合理化された新機能をご覧くだ さい。 [Proseware, Inc. towind traders Windows 11 を入手 スリム ジッフ バックパック 5000 円 现代的な学生 8000 円 突然ですがPDFや画像からテキストを抽出したいけどできない。諦めてキーボード入力をしたなんて経験ありませんか? 画像のテキスト抽出については様々はサードパーティ製のソフトもありiPhoneなどのスマートフォンの標準機能としても今では備わっています。 Microsoftより2023年10月26日に大型アップデートとなる更新プログラム(プレビュー)が配信され、 Windows in Copilot(A

                                        Windows11でSnippingToolから簡単にテキスト抽出(OCR)する方法
                                      • macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。

                                        macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能になるそうです。詳細は以下から。 Appleは現地時間2021年06月07日に完全オンラインで開催したWWDC21の基調講演の中で、macOS 12 MontereyやiOS/iPadOS 15の新機能として「Live Text」という写真内にあるテキストを検出し、編集可能なテキストとしてコピー&ペーストできる機能を発表しました。 Live Text in photos Live Text intelligently unlocks rich and useful information in images, so you can make a call, send an email, or look up directions w

                                          macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。
                                        • 凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発

                                          凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム。共同作業をサポートし、コロナ禍における学習や研究、イベントなどに活用可能 凸版印刷株式会社(本社:東京都千代田区、代表取締役社長:麿 秀晴、以下 凸版印刷)は、高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム「ふみのはゼミ」を開発しました。 授業やイベントでの活用を想定したグループワーク支援機能により、歴史的資料のデジタルアーカイブ化を推進するとともに、コロナ禍における学習・研究の拡大に貢献します。 「ふみのはゼミ」を活用した共同解読作業のイメージ 本サービスは、凸版印刷が2015年から研究・実証試験を行ってきたくずし字OCRをさらに発展させ、凸版印刷総合研究所が開発したAI-OCRの導入による文字

                                            凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発
                                          • 拡散モデルに言語創作をしてほしいなぁ - hsjoihs’s diary

                                            この記事は創作+機械学習 Advent Calendar 2022 の 25 日目の記事です。ところで今は 2022 年 12 月 31 日です。おやぁ。 遅刻しておきながら、実際に計算機を回したりしているわけではない、ある意味少し的はずれな記事内容になってしまい申し訳ありません。一方で、比較的ユニークな話題をこのアドベントカレンダーに持ち込むことができるように努力したので、楽しんでいただければ幸いです。 なお、昨年度は 『架空世界の表意文字用の手書き文字認識を実装したい (part 1)』という記事で創作+機械学習 Advent Calendar 2021 に参加したのですが*1、今年の記事の内容はこの去年の記事と関連があるので、そちらも合わせてお読みいただけるとさらに楽しめるかもしれません。 hsjoihs.hatenablog.com 以下常体で書きます。 想定読者層 言語は一様乱数

                                              拡散モデルに言語創作をしてほしいなぁ - hsjoihs’s diary
                                            • グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化

                                              印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleは米国時間9月1日、同社の「Cloud AI」製品群の新製品と新機能を発表した。「Contact Center AI」(CCAI)の新しい製品と機能のほか、「Document AI」の新バージョンなどがある。さらに、機械学習運用(MLOps)担当者向けに「AI Platform」を刷新したことも明らかにした。 Googleは、同社のAI(人工知能)に関する知見が「Google Cloud」の大きな強みだと考えている。「当社のAI研究に関する進歩をクラウドソリューションに生かし、より良い顧客体験を創出できるようにしている」と、Google Cloud AI&Industry Solutionsで責任者を務めるAndrew Mo

                                                グーグル、「Cloud AI」を拡充--コンタクトセンターや文字認識、MLOps向け機能を強化
                                              • E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス

                                                NDL Ngram Viewerの公開:全文テキストデータ可視化サービス 電子情報部電子情報企画課次世代システム開発研究室・青池亨(あおいけとおる) 国立国会図書館(NDL)は,次世代の図書館システムの開発に役立てるための調査研究を行っており,最近では特に,デジタル化資料の新たな利活用を想定した実験サービスを構築・提供している。 2021年度,NDLはデジタル化資料の光学文字認識(OCR)テキスト化事業に取り組み,国立国会図書館デジタルコレクション(デジコレ)に収録されているほぼ全てのデジタル化資料247万点(2億2,300万画像)のOCRテキストデータを作成した。このOCRテキストデータを活用したサービスとして,2022年5月31日にNDLラボのウェブサイトから実験サービス“NDL Ngram Viewer”を公開した。2022年8月現在,著作権保護期間の満了した図書資料約28万点のテキ

                                                  E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス
                                                • LINEのAI・機械学習の取り組みを一挙紹介〜顔認識入場や電話予約対応AI、不審ユーザ認知など実現 | Ledge.ai

                                                  事前登録された写真から、タブレットで顔認識と入場登録可能会場に到着後、まず目を引いたのが入場登録の顔認証システムだ。事前にLINE経由で写真を登録したうえで、受付にあるiPadを覗き込むと、写真データをもとに顔を認識し15秒程度で入場登録を完了できる。 「AIカンパニー」としての位置づけを強調今回のKeynoteスピーチで特徴的だったのは、2018年に引き続きAI技術そのものにフォーカスした発表がトップを飾ったことだ。スピーチ冒頭でもパク・イビンCTOは、同社のビジョン「LIFE with LINE」に触れ という、同社がよりAI技術へ注力していく方針を示した。 LINE DevDay 2019 Keynote p.5より LINEのAI技術とノウハウが詰まった 「LINE BRAIN」スピーチではパクCTOのほか、AI、データ、セキュリティのパートごとに3名が登壇した。「Natural

                                                    LINEのAI・機械学習の取り組みを一挙紹介〜顔認識入場や電話予約対応AI、不審ユーザ認知など実現 | Ledge.ai
                                                  • 何一つ有効な対策を打たなかった安倍首相が言う「日本モデルの力」とは? - 佐藤章|論座アーカイブ

                                                    何一つ有効な対策を打たなかった安倍首相が言う「日本モデルの力」とは? コロナ第2波に備え必要なのは「日本モデル」の解体だ! 佐藤章 ジャーナリスト 元朝日新聞記者 五月書房新社編集委員会委員長 未曽有のパンデミック状況を呈するコロナウイルスがこの秋から冬にも大きい第2波となって襲い来る予測が広まる中、対策を立てるべきはずの安倍内閣からは危機感がまったく伝わってこない。 この原稿を書いている6月6日の首相動静は以下の通りだった。 午前8時現在、東京・富ケ谷の私邸。朝の来客なし。午前中は来客なく、私邸で過ごす。午後4時9分、私邸発。午後4時20分、官邸着。同30分から同50分まで、加藤勝信厚生労働相、菅義偉官房長官、西村康稔経済再生担当相、西村明宏、岡田直樹、杉田和博各官房副長官、北村滋国家安全保障局長、和泉洋人、長谷川栄一、今井尚哉各首相補佐官、樽見英樹新型コロナウイルス感染症対策推進室長、

                                                      何一つ有効な対策を打たなかった安倍首相が言う「日本モデルの力」とは? - 佐藤章|論座アーカイブ
                                                    • デジタル庁、デジタルFAXの開発を表明 | スラド

                                                      日本のIT環境の後進性の象徴となったFAXを一掃するため、デジタル庁は「デジタル社会形成の司令塔として、未来志向のDXを大胆に推進し、デジタル時代の官民のインフラを今後5年で一気呵成に作り上げることを目指します。」ための切り札として、デジタルFAXの開発を表明した。 デジタルFAXの特徴は以下になる。 ・8K解像度/10bitカラー/HDR ・光回線前提 ・IPv6 ・AIによる文字認識 ・送受信音はDSD(Direct Stream Digital)によるデジタル化 ・「デジタル庁指定」の刻印

                                                      • 人気Androidアプリがアップデートでマルウェア配信開始、削除される

                                                        印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleは、「CamScanner」という広く普及している「Android」アプリがマルウェアを配信し始めたことを受け、「Google Play」ストアから削除した。同アプリは文書をスキャンしてPDFに変換したりできるもの。 上海に拠点を置くCC Intelligenceが公開している同アプリは、2010年にGoogle Playストアで提供開始されて以来、1億回以上ダウンロードされている。 同社は光学文字認識(OCR)を得意とする企業であり、OCRによる文字認識機能を備えたCamScannerアプリ以外にも、「CamCard」や「CamCard for Salesforce」などの、名刺に印刷された文字を読み取るアプリも販売してい

                                                          人気Androidアプリがアップデートでマルウェア配信開始、削除される
                                                        • 長尾真・京都大元総長が死去 文化勲章、人工知能研究で業績|社会|地域のニュース|京都新聞

                                                          元京都大総長で人工知能(AI)研究に多くの業績を挙げた長尾真(ながお・まこと)氏が23日に出血性脳梗塞のため死去していたことが、26日分かった。84歳。三重県出身。葬儀・告別式は近親者で行った。喪主は妻の美紀子(みきこ)さん。 長尾氏は、京大工学部卒。工学部講師や助教授を経て1973年に教授となり、大型計算機センター長や付属図書館長、工学研究科長などを歴任した後、97年~2003年に総長を務めた。 総長在任中は桂キャンパス(京都市西京区)を開設し、創立100周年記念事業として「百周年時計台記念館」を完成させた。また国立大学協会長として、法人化に向け全国の国立大の意見をとりまとめた。 総長退任後は、国立国会図書館長として、電子図書館化を推進。国際高等研究所(木津川市)所長、京都府公立大学法人理事長も務めた。 専門は情報学。研究の成果はさまざまな分野に応用され、文字認識は郵便番号の読み取り装置

                                                            長尾真・京都大元総長が死去 文化勲章、人工知能研究で業績|社会|地域のニュース|京都新聞
                                                          • なぜ学校からのお手紙は電子化されないのか?家庭と教育現場のデジタル・デバイド|CHANTO WEB

                                                            多くの学校では紙で配られるので、重要なお知らせがどれだったか分からなくなったり、紛失したりという経験をしたことがある方も多いのでは。 どうして未だに、配布物の電子化が進まないのでしょうか。 そして、電子機器と子どもたちの距離感について、私たちはどう考えればいいのでしょうか。 教育と情報化に詳しい、国際大学GLOCOM主幹研究員・准教授の豊福晋平先生にお話を伺いました! 世界に遅れる日本の教育現場 ──現在、学校からのお知らせはほとんどの場合紙で配られており、それに対して不満を持つ親も少なくありません。日本のこの現状は世界と比べてどうなのでしょうか? 豊福先生 経済協力開発機構(OECD)による生徒の学習到達度調査(PISA)2018の結果が2019年12月に発表され、日本は読解力の順位が下がったなどとして話題になりました。PISAには学習環境の調査も含まれており、施設の状況やITをどのくら

                                                              なぜ学校からのお手紙は電子化されないのか?家庭と教育現場のデジタル・デバイド|CHANTO WEB
                                                            • Open Interpreterで開かれた未来像 RPAツールをAIで作る

                                                              Open Interpreterで開かれた未来像 RPAツールをAIで作る 2023.09.12 Updated by Ryo Shimizu on September 12, 2023, 11:25 am JST OpenInterpreter(オープンインタープリター)が話題だ。 これはChatGPTの「Code Interpreter」をローカルで動かすというもの。 しかも、GPT-3/GPT-4のAPI以外にも、Llama2やFalconなどのローカル動作のLLMのエンジンにも容易に切り替えることができる。 筆者も早速試してみたが、これが非常に面白い。ChatGPT出現時くらいのインパクトがある。 筆者は最近、平日はほぼ毎日「教養としてのAI講座 / デイリーAIニュース」という有料番組を配信している。 この中で先週とりあげたのがOpen Interpreterだったのだが、この反

                                                                Open Interpreterで開かれた未来像 RPAツールをAIで作る
                                                              • 今週のお題「試験の思い出」。 - おっさんのblogというブログ。

                                                                今週のお題「試験の思い出」 如何お過ごしですか? 3回連続10cmです。 当ブログにお越しいただきありがとうございます。 いつも本当にありがとうございます。 試験会場でしか生まれないドラマがある 今週のお題は「試験の思い出」です。 だって。 ってことで、試験とは違うかも分からんけど、私が高校の頃の俗に言うテスト(学期ごとにあるやつ)の思い出を書いてみることにします。 みんなはどうか知らんけど、私は『テスト=試されている』イメージがあってイヤでしたね。 それに年に何回も何回もしなくていいやん。 ってな感じでいいイメージは全くなかった。 落第したらいかんけん受けてはいたけどね。 テストの思い出。 仕込みは手作業。 カンニング方法(原始的方法2種)。 センセに見つかるか見つからないかは別にして、消しゴムやマッチ箱のデメリット。 【番外】 編集後記 テストの思い出。 もうね、テストの思い出っちゃ、

                                                                  今週のお題「試験の思い出」。 - おっさんのblogというブログ。
                                                                • ロボテックとは [単語記事] - ニコニコ大百科

                                                                  ロボテック単語 84件 ロボテック 3.1万文字の記事 8 0pt ほめる 掲示板へ 記事編集 概要海外での地位と反響コスチューム・プレイハーモニーゴールド USA 社による原作マクロス輸入妨害ハーモニーゴールド社のアカデミー社に対する「商標使用許諾の無断取り消し」中止されたファン制作映画 「プロジェクト・バルキリー」その他の国々での扱いコミック・小説・TRPG拡張された独自用語VERITECH (ベリテック)可変機動兵器・区分表VERITECH (ベリテック)関連・ニコニコ静画玩具「ロボテック」 と 原作「超時空要塞マクロス」の歴史的和解への最新動向タツノコに対するハーモニーゴールド USA社のライセンス返還ライセンス返還後の動きを見越した各社の商品展開パラディウム・ブックス社のトラブルと 返還金の請求騒動影響を受けた著名人関連動画関連商品関連項目外部リンク脚注掲示板ロボテックとは、日本

                                                                    ロボテックとは [単語記事] - ニコニコ大百科
                                                                  • 機械学習×名古屋×Julia Juliaとの出会いとこれまでにやってきたこと Part1

                                                                    2018年10月20日、第8回目となるイベント「JuliaTokyo」が開催されました。技術計算を得意とする新しい汎用プログラミング言語であるJulia。その知見と共有しJuliaの普及を促すため、実際にJuliaを用いているエンジニアたちが一堂に会し、自身の事例を語りました。プレゼンテーション「機械学習×名古屋×Julia 」に登場したのは、antimon2氏。講演資料はこちら 機械学習×名古屋×Julia antimon2氏:では始めます。仮で「機械学習と名古屋とJulia」っていう名前で送っていて、「と」が「×」に変わっただけですが、正式に「機械学習×名古屋×Julia」というタイトルで発表を進めていきます。 今日話す内容はだいたいこんな感じです。自分のこと、あと機械学習、実際にどういうふうなのかを順番に話していきます。 まずは私のことなんですけど、「私×Julia」というか「お前誰

                                                                      機械学習×名古屋×Julia Juliaとの出会いとこれまでにやってきたこと Part1
                                                                    • Raspberry Pi4 model BでTensorflow.jsやPythonの基礎を学習——「はじめてのAIプログラム学習キット4」 |fabcross

                                                                      同キットでは、第三世代としてRaspberry Pi4 Model BやTensorflow.js(java script)がリリースされたことに伴い、AIプログラム学習キットを最新化。Raspberry Pi 4 Model Bを使用して、Googleが開発したディープラーニングソフトTensorflow.jsや、動作させるためのPythonの基礎を学習、体験できる。今回提供されるPythonのバージョンはPython3.6で、最新OSのRasbian busterに対応している。 サンプルプログラムと練習問題100問により、プログラミングを習得する形式を採用。習得期間は標準で30時間を見込む。また応用例として、Tensorflowを使った文字認識(MNIST)、画像認識(CIFAR-10,IRIS)、自然言語処理(word2vec)、DNN(車両価格予測、不動産価格予測)などのプログラ

                                                                        Raspberry Pi4 model BでTensorflow.jsやPythonの基礎を学習——「はじめてのAIプログラム学習キット4」 |fabcross
                                                                      • end-to-endの文書画像認識モデルDonutをファインチューニングする|oshizo

                                                                        DonutはOCRを使わないend-to-endの文書理解モデルです。 Vision Encoder Decoder Modelになっており、OCRエンジンに依存せずに視覚的な文書分類や情報抽出を高い精度で行うことができます。 Donutは日本語を含む4言語で学習されたモデルnaver-clova-ix/donut-baseが公開されており、日本語で何かしたいときにファインチューニングして使えそうだなと思っていました。 今回、AIキャラクターと一緒にノベルゲームをプレイするために、ノベルゲーム風画面の合成データセットでdonut-baseをファインチューニングしました。 以下を目標として作成しました。 <unk>になる漢字をvocabに追加して学習する 選択肢、名前、メッセージを別々に認識し、jsonを出力する SKIP、LOADなどのUIの文字、日付表示などを読み取らない ルビを無視する

                                                                          end-to-endの文書画像認識モデルDonutをファインチューニングする|oshizo
                                                                        • NEC、従来の半分のデータ量で精度良く学習するディープラーニング技術を開発

                                                                          NECは8月19日、従来の半分の学習データ量で高い識別精度を維持できるディープラーニング技術を発表した。元データの種類を問わないため、画像や音声などさまざまなデータに対し適用できるとしている。 ディープラーニングには、元データを示す「入力層」と回答を示す「出力層」の間に、元データの特徴を抽出する「中間層」が複数ある。NECが開発した技術では、中間層の特徴量を意図的に変化させ、識別が難しいデータを集中的に生成して識別精度を高めている。 同社によると、文字認識や物体認識の標準的なデータセットに対し同技術を適用したところ、従来の半分の学習データ量で従来と同等の精度を実現できたという。 一般的にディープラーニングの識別精度を高めるには、識別が難しいデータを多く学習することが有効とされている。従来は学習用の画像データを意図的に加工、変形させてデータ量を増やす「データ拡張」という手法を使っていたが、十

                                                                            NEC、従来の半分のデータ量で精度良く学習するディープラーニング技術を開発
                                                                          • iOSのVision.framework活用事例 〜 PayPayフリマのクレカ番号読み取り機能実装例

                                                                            ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。PayPayフリマでiOSアプリ開発を担当している伊藤(@shizuna_it)です。PayPayフリマYahoo! JAPAN Tech Blogの第二弾です! PayPayフリマは、誰でも気軽に、安心して個人間取引ができるフリマアプリです。(PayPayアプリの中からも使えます) PayPayフリマのiOSアプリでは、Swift Package Manager(SwiftPM)でライブラリ管理を行うようにリファクタリングを進めています。その過程で私達はVision.frameworkを活用してクレジットカード番号読み取り機能を独自実装しました。この記事では、実際に起きていた技術負債とその解消のための実装をサンプルコ

                                                                              iOSのVision.framework活用事例 〜 PayPayフリマのクレカ番号読み取り機能実装例
                                                                            • 「文字をきれいに読み取る」だけじゃないOCR――freeeに学ぶAI開発で本質的価値を提供する方法 | Ledge.ai

                                                                              会計サービスをはじめ、バックオフィス向けクラウドソフトを提供するfreee。単純作業を効率化し、ユーザーが本質的な仕事に集中できる環境を提供するために、AI技術を駆使したさまざまな取り組みがなされている。 「ユーザーにとって本質的に価値があること(同社では「マジ価値」と呼ばれる)を届けきる」をコミットメントとして掲げる同社の、AI技術を使ったアプローチ方法を連載形式でお届けする。 第2回のテーマはOCR。紙の領収書や、請求書とにらめっこし、その扱いにうんざりしている経営者は少なくないだろう。 これら紙の文書をよりスムースに扱うため、freeeのサービスに実装されている独自のOCR機能を、同社機械学習エンジニアの田中浩之氏に紹介していただく。 はじめにfreeeでは「スモールビジネスを、世界の主役に。」をミッションに掲げ、「アイデアやパッションやスキルがあればだれでも、ビジネスを強くスマート

                                                                                「文字をきれいに読み取る」だけじゃないOCR――freeeに学ぶAI開発で本質的価値を提供する方法 | Ledge.ai
                                                                              • Raspberry Piクックブック 第3版

                                                                                本書は、登場以来多くのユーザーの支持を集め続けているマイコンボード「Raspberry Pi」を使いこなすための267本のレシピ集です。ハードウェアの基本、オペレーティングシステムの使い方、ネットワーク接続、Pythonプログラミングの基本から、高度なPythonプログラミング、GPIO(汎用入出力)、モーター、センサー、ディスプレイ、コンピュータービジョン、Arduinoとの連携まで、幅広いニーズに応えます。最新の「Raspberry Pi 4」ならびに刷新されたRaspberry Pi OSに対応しており、新たにサウンドやホームオートメーションのレシピも加わりました。すぐに使えるサンプルコードや回路図を豊富に収録しており、作品製作に役立ちます。 まえがき この本の使い方 表記規則 サンプルコードの使用について 質問と意見 謝辞 1章 設定と管理 レシピ1.1 Raspberry Piの

                                                                                  Raspberry Piクックブック 第3版
                                                                                • ナンバープレート偽装防止のために生み出されたフォント「FE-Schrift」とは?

                                                                                  by StockSnap 世の中にはさまざまなフォント(書体)があり、フォントの違いによって人が文字から受ける印象が変わったり、同じ文面でもよりインパクトが強くなったりします。「FE-Schrift」というフォントは「ナンバープレートの偽装を防止する」という目的で開発された特殊なフォントであり、今や多くの国々で採用されています。 FE-Schrift - Wikipedia https://en.wikipedia.org/wiki/FE-Schrift FE-SchriftのFEとは、ドイツ語の「Fälschung(改ざん)」と「erschweren(防止)」の頭文字をとったものであり、Schriftはドイツ語でフォントを意味します。FE-Schriftはドイツで生まれたサンセリフフォントであり、文字の飾り(セリフ)がなく、わずかに太めで均等な文字の幅は機械による読み取りが容易なだけでな

                                                                                    ナンバープレート偽装防止のために生み出されたフォント「FE-Schrift」とは?