並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 584件

新着順 人気順

文字認識の検索結果161 - 200 件 / 584件

  • API Diffsから見るiOS 13の新機能 #WWDC19 - Qiita

    本日からはじまったWWDC 2019、SwiftUIをはじめ実にワクワクする新機能が盛りだくさんでした。iOS 13のドキュメントが公開されたので、明日からのセッションでどのへんを勉強するかの予習をかねて、気になった新APIをピックアップしておきます。 Vision 人間検出 VNDetectHumanRectanglesRequest 人間を矩形で検出。 ↓はOpenCVを使った結果ですが、こういうのです。 ARKitのpeople segmentationがインパクトありすぎて「矩形で検出」というのは印象薄いですが、「こういうのもあったな」と頭の片隅に置いておくといつか用途があるかもしれません。 文字認識 VNRecognizeTextRequest 文字認識。従来から備えていた文字領域検出ではなく、文字認識、いわゆるOCR的なやつです。 今まで無料で使えるやつだとtesseractと

      API Diffsから見るiOS 13の新機能 #WWDC19 - Qiita
    • 岩波新書の青版・黄版など100タイトルが初めて電子化、ほぼすべてがリフロー型の新字体で配信 | HON.jp News Blog

      2019/10/16 12:51 (JST)10/16 13:36 (JST)updated ©NPO法人HON.jp 株式会社岩波書店は、岩波新書の定番ロングセラーから青版・黄版を中心とした100タイトル107点を初めて電子化、9月26日から3カ月連続で一挙配信する「岩波新書eクラシックス100」を始動した。ほぼすべてがリフロー型で、旧字体は新字体に改められている。 今回電子化されたタイトルは、1949年から1977年に刊行された青版と、1977年から1987年に刊行された黄版を中心に選ばれている。岩波新書編集部によると、選定基準は戦後日本を代表する知識人の著作や、重版刷数の多いもの、読者から電子化リクエストが寄せられていたもの、品切れになっていたもの、復刊したら売れ行きがよかったものなどだ。 9月26日に配信が開始されたタイトルは、久野収/鶴見俊輔『現代日本の思想─その五つの渦』(初版

        岩波新書の青版・黄版など100タイトルが初めて電子化、ほぼすべてがリフロー型の新字体で配信 | HON.jp News Blog
      • 【開催報告】ML@Loft #4 (Edge) | Amazon Web Services

        AWS Startup ブログ 【開催報告】ML@Loft #4 (Edge) こんにちは、スタートアップソリューションアーキテクトの針原 (Twitter: @_hariby) です。7月19日に AWS Loft Tokyo で開催された機械学習のコミュニティイベント ML@Loft の第4回では Edge Deep Learning をはじめとした技術についての話が盛り上がりました。興味はあったけど予定が合わなかった、という方のために内容をまとめたいと思います。 ML@Loft は機械学習のお悩み相談イベントで、目黒の AWS Loft Tokyo で2019年4月より毎月開催されています。もともとは AWS をお使いのお客さまが、サービスの中に機械学習を取り入れて開発・運用していく際のお悩を気軽に相談できる場が欲しい、ということで始まったイベントです。登壇者 (相談役) が自己紹介

          【開催報告】ML@Loft #4 (Edge) | Amazon Web Services
        • 画像認識AIの事前学習に写真がいらなくなる?新技術「FDSL」登場! - ナゾロジー

          画像認識AIというとどんなイメージが浮かぶでしょうか? 身近な例では、スマホの顔認証や、画像の文字をテキスト化する文字認識などに使われるAI技術が挙げられます。 画像認識AIが世に出されるには、開発における事前学習の段階で使用されるデータセットに大量の写真が必要です。 しかし、データセットの作成は、従来のやり方では人間の作業量が膨大になるほか、画像収集自体が困難な場合もあります。 そこで最新技術として、写真が含まれないデータセットを用いた高精度な画像認識AIモデルを構築する手法が開発されました。 なんと、写真の代わりに、数式によって生成された画像を使用したそうです。 この技術はFormula-driven Supervised Learning(FDSL)と称され、2022年6月に産業技術総合研究所の片岡主任研究員のグループにより発表されました。

            画像認識AIの事前学習に写真がいらなくなる?新技術「FDSL」登場! - ナゾロジー
          • CA2004 – 日本の機関リポジトリにおけるPDFファイルの長期保存とアクセシビリティ / 安形 輝, 宮田洋輔, 池内 淳

            4. まとめ 今回行った調査の結果から、日本の機関リポジトリにおいて公開されたPDFファイルについては、(1)PDF/Aという長期保存に適した規格で作成されたPDFファイルはほとんどなかったこと、(2)30.5%のPDFファイルが暗号化されており、アクセシビリティの視点から問題があり、将来的に他の形式への変換が阻害されていること、(3)多くのPDFファイルは、機関リポジトリのメタデータから独立して流通する際の十分なメタデータが埋め込まれていなかったこと、の三点が明らかになった。 上記の結果から日本の機関リポジトリに含まれるPDFファイルの多くは、長期保存やアクセシビリティの視点からはさまざまな問題を抱えているといえる。オープンアクセスを実現するために機関リポジトリで組織に所属する研究者の研究成果をPDFファイルとして公開する場合に、単に受け取ったPDFファイルを置くだけでは十分とは言えない

              CA2004 – 日本の機関リポジトリにおけるPDFファイルの長期保存とアクセシビリティ / 安形 輝, 宮田洋輔, 池内 淳
            • あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判

              アメリカのノースカロライナ州では、民間企業が提供する自動車のナンバープレートを読み取るカメラシステムを導入しています。このシステムは通過する全ての車両のナンバープレートや特徴をキャプチャし、犯罪に関連する車両だけでなく一般市民の車両のデータも収集することができ、州内外の法執行機関のみが捜査目的でアクセスできるようになっています。しかし、このカメラシステムについて、プライバシー擁護派からは厳しい批判の目が向けられています。 Increase in roadside cameras brings more surveillance to NC | Raleigh News & Observer https://www.newsobserver.com/news/state/north-carolina/article286920890.html One Company Is Recording

                あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
              • iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ

                「iOS 15」および「iPadOS 15」に搭載される「テキストの認識表示(Live Text)」機能。 写真の中にある文字部分をタップすることで、テキストとして認識し、電話をかけたり、Eメールを送ったり、(A12 Bionic以降であれば)道順を調べることも可能になります。 iOS 15:テキストの認識表示 その方法としては、 写真をアプリを開く レストランのメニューや商品のタグなど、文字が写っている写真を探す 文字が小さく表示されている場合は、ピンチ操作で写真を拡大するなど調整 文字部分を長押しすることで選択ツールが出現。選択ツールの端をドラッグして、コピーしたい文字をハイライト 画面から指を離し、ポップアップメニューから「コピー」や「翻訳」を選択 メモなどを開き、ペーストする これで写真にあるテキストを活用できるようになります。 下の写真はメモアプリに認識したテキストをコピペしたと

                  iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ
                • 「LINE CONFERENCE 2019」を開催 | ニュース | LINE株式会社

                  LINE株式会社(本社:東京都新宿区、代表取締役社長:出澤 剛)は、本日、「LINE CONFERENCE 2019」を開催しましたので、お知らせいたします。 ■セッション/登壇者 1)Keynote “Life on LINE” 慎 ジュンホ(代表取締役 CWO) 出澤 剛(代表取締役社長 CEO) 2)Communication Platform 稲垣 あゆみ(上級執行役員 LINEプラットフォーム企画統括) 3)Content Platform 島村 武志(上級執行役員 ポータル・メディア事業統括) 4)Entertainment Platform 舛田 淳(取締役 CSMO) 5)Mobile Payment Platform 長福 久弘(LINE Pay株式会社 取締役 COO) 6)Financial Platform 出澤 剛 7)Commerce Platform 藤井 英

                    「LINE CONFERENCE 2019」を開催 | ニュース | LINE株式会社
                  • うろおぼえ虎の巻 補足

                    本編に戻る : anond:20211105031842 基本的にGoogleの検索オプションや、Twitterの検索コマンドは各自で検索していただきたい。 ...が、コイツ何やってんだよサッパリわからん!と言われないために記しておく。 Twitterの検索オプション参考サイト : https://mag.app-liv.jp/archive/81735/ Twitter検索で主に使用するのは min_retweets:xx-(除外検索)""(完全一致検索)lang:ja(日本語のツイートのみ検索)since:20XX-XX-XX(指定した年月日 以後)until:20XX-XX-XX(指定した年月日 以前)くらい。これらを検索語句に加える。本当に出て来なかったら調べると吉。 曲の検索の際、歌詞検索などでbotが邪魔!という時は -source:twittbot.net このように除外する

                      うろおぼえ虎の巻 補足
                    • 年末年始に、書籍の自炊・電子化を進めてみませんか? - テトたちのにっきちょう

                      こんにちは。テトです。 2020年も残すところあと1日ですね。 年末年始の大掃除は進んでいますか? ふと、本棚に目をやると、持っている本が本棚を圧迫していませんか? でも新しい本棚を置くスペースがない… そんな時に便利なのが! 書籍を裁断・スキャンしPDFにして電子ファイル化する"自炊"です。 今回はそんな自炊のメリットと、始める前の疑問点・不安を解消していきたいと思います。 自炊のメリット 省スペース化 スマホを無限の本棚に 文字検索ができる 過去の本を安く読める 自炊はここがデメリット? Q.自炊って違法じゃないの? Q.手間とか時間かかるんじゃないの? Q.メンテナンスが大変そう Q.データサイズがかさみそう…… Q.でも、お高いんでしょ? まとめ おまけ 自炊のメリット まず、私が自炊生活を始めることによって得られたメリットを示していきたいと思います。 省スペース化 第一に分かりや

                        年末年始に、書籍の自炊・電子化を進めてみませんか? - テトたちのにっきちょう
                      • PythonとOCRエンジンで画像から文字を認識する - Qiita

                        目的 anacondaの仮想環境内でtesseractとPyOCRを使い、画像から文字を認識できるようにします。 今回は画像の文字を認識し、ターミナルへ出力できるところまでの行います。 こんな感じ↓ 環境 python 3.6 tesseract 4.1.1 PyOCR 0.8 手順 ツールのインストール anacondaの仮想環境に下記2つをインストールします。 ・文字認識のためのOCRエンジンであるTesseract OCRをインストール https://anaconda.org/conda-forge/tesseract

                          PythonとOCRエンジンで画像から文字を認識する - Qiita
                        • 52. Split into a row | Researchat.fm

                          ゲストにkotoneさんを招き、ディープラーニング、機械学習とそのアルゴリズムや計算用マシンについて話しました。Show notes 機械学習 (Wikipedia) ディープラーニング(深層学習) (Wikipedia) ニューラルネットワーク (Wikipedia) パーセプトロン (Wikipedia) GPU (Wikipedia) ディープラーニング入門 Chainer チュートリアル 株式会社 Preferred Networks Chainer NVIDIA CUDA-X GPU-Accelerated Libraries for AI and HPC Preferred Networks、1024個のGPUでディープラーニングの世界最高速を実現と発表 NARUTO -ナルト- 疾風伝 ナルト全巻セット ImageNet…学習用の画像データセット 畳み込みニューラルネット(W

                            52. Split into a row | Researchat.fm
                          • 生成 AI を使用して従業員の生産性向上を支援する Amazon Q Business の一般提供開始 | Amazon Web Services

                            Amazon Web Services ブログ 生成 AI を使用して従業員の生産性向上を支援する Amazon Q Business の一般提供開始 AWS re:Invent 2023 では、Amazon Q Business のプレビューを行いました。Amazon Q Business は、エンタープライズシステム内のデータと情報に基づいて質問に答え、要約を提供し、コンテンツを生成して、タスクをセキュアに完了することができる、生成 AI 駆動のアシスタントです。 Amazon Q Business を使用することで、組織のユーザーが想像力、効率性、および生産性を高め、データに基づいて行動し、準備を整えることを可能にする、セキュアでプライベートな生成 AI アシスタントをデプロイできます。プレビュー中、私たちはお客様からたくさんのフィードバックをいただき、そのフィードバックを使用してサ

                              生成 AI を使用して従業員の生産性向上を支援する Amazon Q Business の一般提供開始 | Amazon Web Services
                            • 【ML Kitで】来場者が身に着けたQRコードを自動取得するAI Marker(α版)の話【Androidアプリ開発】 - OPTiM TECH BLOG

                              はじめに AI Markerとはなんぞや OPTiM INNOVATION 2019でAI Markerお披露目 必要なスペック 技術選定 QRコードのライブラリ選定 ML Kitは便利 quickstart-android/mlkit紹介 (おまけ)QRコードの精度向上について (番外編)ARマーカーじゃダメなの? 取得したQRコードの管理 時刻の取得 ファイル名の決定 ファイルストレージへの書き込み ハードウェア選定 耐久テスト いざ本番 電源抜けでバッテリー切れ QRコードが服に隠れて認識できない 動作確認が大変 ログデータ解析と成果物 お礼メール作成 ブースの分析 最後に はじめに こんにちは、R&Dチームの加藤です。Raspberry Pi4を買った*1ので、まずは3Dプリンタでケースを作ります。今日はそんなRaspberry Piの話・・・ではなく、AI Markerについて技

                                【ML Kitで】来場者が身に着けたQRコードを自動取得するAI Marker(α版)の話【Androidアプリ開発】 - OPTiM TECH BLOG
                              • 売上高4割失うAI inside、社長が打ち明けた誤算と解約を見抜けなかった理由

                                パートナーであるNTT西日本から契約の一部を更新しないとの通知を受け、総売上高の約4割に当たる17億6300万円の売り上げが2022年3月期に減少するとの見込みを発表したAI inside。2021年5月12日の決算発表で継続的な成長を主張したものの、株価の下落が止まらない。問題の本質はどこにあり、どんな成長の手を打っていくのか。同社の渡久地択代表取締役社長CEO(最高経営責任者)を単独取材した。(聞き手は島津 翔=日経クロステック) NTT西日本が販売していたAI insideのOEM(相手先ブランドによる生産)商品で、顧客が次々に解約する事態が明らかになりました。問題の本質はどこにありましたか。 NTT西日本とのパートナー契約を結んだ当初、我々もNTT西日本も、これだけのライセンス数(編集部注:2021年3月末時点で9284件)が獲得できるとは全く思っていませんでした。NTT西日本から

                                  売上高4割失うAI inside、社長が打ち明けた誤算と解約を見抜けなかった理由
                                • 商品パッケージの校正、AIで省力化 「作業の負担7割減」へ DNP、飲料メーカーなどと検証

                                  DNPは、商品パッケージ制作時に、必要な表示が正しく記載されているかなどを確認する校正・校閲作業を、AIを活用して省力化する取り組みを強化する。さまざまな形状のパッケージの文字を認識し、パッケージ原稿との差異をAIで抽出。差異があったところだけを人間がチェックすることで、校閲・校正作業負担の7割削減を目指す。 大日本印刷(DNP)は、商品パッケージ制作時に、必要な表示が正しく記載されているかなどを確認する校正・校閲作業を、人工知能(AI)を活用して省力化する取り組みを強化する。各メーカーが製造するさまざまな形状のパッケージの文字を認識し、パッケージ原稿との差異をAIで抽出。差異があったところだけを人間がチェックすることで、校閲・校正作業負担の7割削減を目指す。 企業が商品パッケージを制作する際は、関連法令や業界内のルールに加え、ロゴやマークなど企業独自のルールにも準拠する必要があり、社内の

                                    商品パッケージの校正、AIで省力化 「作業の負担7割減」へ DNP、飲料メーカーなどと検証
                                  • 無料オンラインOCR - EzOCR

                                    無料オンラインOCR - EzOCR 無料オンラインOCR-EzOCR PDFや画像(JPG、PNG等)の文字認識を行い、簡単にテキスト変換します。 - PDFや画像(JPG、PNG等)の文字認識を行い、簡単にテキスト変換します -

                                    • Azure OpenAI Service モデル - Azure OpenAI

                                      GPT-4 Turbo GPT-4 Turbo は、大規模なマルチモーダル モデル (テキストまたは画像の入力を受け入れ、テキストを生成します) であり、OpenAI の以前のモデルよりも高い精度で困難な問題を解決できます。 GPT-3.5 Turbo や以前の GPT-4 モデルと同様に、GPT-4 Turbo はチャット用に最適化されており、従来の入力候補タスクでも適切に動作します。 GPT-4 Turbo の最新の GA リリースは次のとおりです。 gpt-4バージョン:turbo-2024-04-09 これは、次のプレビュー モデルに代わるものです。 gpt-4バージョン:1106-Preview gpt-4バージョン:0125-Preview gpt-4バージョン:vision-preview OpenAI と Azure OpenAI GPT-4 Turbo with Visi

                                        Azure OpenAI Service モデル - Azure OpenAI
                                      • 「あれば便利」を超えて「ないのは考えられない」までの利便性 LINEのコンピュータビジョン研究が目指すもの

                                        CVLはどこへ向かうか 栄藤稔氏(以下、栄藤):さて、次のアジェンダにいきましょうか。つまり、コンピュータビジョンのこれまでの実績は盛り上がったところですが、じゃあ次に、7月1日に発足したコンピュータビジョンラボ、CVLがどういう方向でいくかっていう話。また、今後3Dの技術はどう進んでいくかという話について、もう少し聞いてみたいと思います。これは、藤原さんかな。 藤原研人氏(以下、藤原):先ほどまでの研究は、実はスチル画像やスチルの3次元情報だったのですが、止まっている情報ってかなり限られていますよね。我々も常に動いていますし。動作が伴う情報を見据えた研究もしなければいけないので、同時に進めています。 例えば3次元のCGの動きを生成することを可能にして、これまで障壁になっていたアニメーションを作るうえでの人手の足りなさや困難さを取り除くツールなどを作成して、より多くの人がコンテンツ生成など

                                          「あれば便利」を超えて「ないのは考えられない」までの利便性 LINEのコンピュータビジョン研究が目指すもの
                                        • 無料でも使えるようになった!おすすめノートアプリのGoodNotes5 - トザワブログ

                                          みなさん、こんばんは。 ふだんメモ帳として使っているGoodNotes5アプリ。 今までは買い切りで税込980円の有料アプリでした。 それが、よりデジタルペーパーを体験してもらうために無料で使うことができるようになりました。 一冊一冊ノートのように使うことができるGoodNotes5。 提供しているアプリはiPhone、iPad、Macになります。 無料版と有料版の大きな違いはノートの数と文字認識機能。 無料版はノートが三冊までと文字認識が使えません。 私は有料版ですが一冊しかノート使っていないです。 無料版の三冊で十分すぎる。 ただ文字認識がとても便利なんです。 手書きで書いた文字も検索できるので、あとあと目的のものを探すときは、あると便利な機能。 私はGoodNotes5を毎日使ってます。 紙のノートはしばらく使ってません。 いろいろ使い方はありますが、手書きの日記みたいに利用してます

                                            無料でも使えるようになった!おすすめノートアプリのGoodNotes5 - トザワブログ
                                          • 一般財団法人人文情報学研究所(監修)石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』(文学通信)

                                            文学通信|多様な情報をつなげ、多くの「問い」を世に生み出す出版社 日本語・日本文学の研究書を中心に、人文学書全般を刊行する出版社、文学通信のブログ。 文学だけにこだわらず周辺領域も含め、意欲的に刊行していきます。 出版活動と同様に、webでも積極的に活動することで、多様な情報をつなげ、多くの「問い」を世に生み出していきたいと思います。 〒113-0022 東京都文京区千駄木2-31-3 サンウッド文京千駄木フラッツ1階101 電話03-5939-9027 FAX03-5939-9094 info@bungaku-report.com インボイス登録番号:T4011501023591 ホーム 一般財団法人人文情報学研究所(監修)石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』(文学通信)

                                              一般財団法人人文情報学研究所(監修)石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』(文学通信)
                                            • OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ

                                              米OpenAIは11月9日(現地時間)、AIモデルをトレーニングするためのパブリックおよびプライベートのデータセットを構築するためにサードパーティと協力するパートナーシップ「OpenAI Data Partnerships」の立ち上げを発表した。 同社は公式ブログで、このパートナーシップの目的は「より多くの組織がAIの将来の舵取りを支援できるようにし」「より有用なモデルから恩恵を受けられるようにすること」と語った。 「最終的に全人類にとって安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解」する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。 データには、画像、音声、動画などを含める予定で、多様な言語、トピック、形式での長文のテキストや会話など、「人間の意図を表現する」データも含める計画。 パートナーシップ参加組織と協

                                                OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ
                                              • 中日新聞:自動車工場のガロア体 QRコードはどう動くか

                                                その誕生を地元新聞も経済新聞も記事にしなかった。2年後、『コードの情報を白黒の点の組み合わせに置き換える』と最下段のベタ記事で初めて紹介された時、その形を思い浮かべることができる読者はいなかった。いま、説明の必要すらない。QRコードはなぜ開発され、どう動くのだろうか。 QRコードは、自動車生産ラインの切実な要請と非自動車部門の技術者の「世界標準の発明をしたい」という野心の微妙な混交の下、1990年代前半の日本電装(現デンソー)で開発された。 トヨタグループの生産現場では、部品名と数量の記された物理的なカンバンが発注書、納品書として行き来することで在庫を管理する。そのデータ入力を自動化するバーコード(NDコード)を開発したのがデンソーだ。 バブル全盛の1990年ごろ、空前の生産台数、多様な車種・オプションに応えるため、部品も納入業者も急激に増え、NDコードが限界を迎えていた。63桁の数字しか

                                                • 進歩がすさまじい「機械翻訳」、その理由をトップ技術者に聞く

                                                  リクルート入社後、事業企画に携わる。独立後、経営・組織コンサルタントとして、各種業界のトップ企業からベンチャー企業、外資、財団法人など様々な団体のCEO補佐、事業構造改革、経営理念の策定などの業務に従事。現在は、経営リスク診断をベースに、組織設計、事業継続計画、コンプライアンス、サーベイ開発、エグゼクティブコーチング、人材育成などを提供するプリンシプル・コンサルティング・グループの代表を務める。京都大学卒。国際大学GLOCOM客員研究員。麹町アカデミア学頭。 著書に『「一体感」が会社を潰す』『それでも不祥事は起こる』『転職後、最初の1年にやるべきこと』『社長!それは「法律」問題です』『インディペンデント・コントラクター』『愛社精神ってなに?』などがある。 組織の病気~成長を止める真犯人~ 秋山進 日本には数多の組織があり、多くの人がその中に属しています。組織は、ある目的のために集まった人た

                                                    進歩がすさまじい「機械翻訳」、その理由をトップ技術者に聞く
                                                  • GASでOCRを簡単に使えるんですか!?

                                                    この記事のひとことまとめ GASでgoogle Driveのフォルダーにアップロードされた画像(PDFもいけます)からgoogle drive APIとDocumentApp ClassをつかってOCRし情報をテキストとしてとりだす方法を紹介します。 これを使うことで、以下のようなことができると思います。 紙のシフト表をスマホでとってDriveにあげてグーグルカレンダーやタイムツリーにシフトを自動登録する レシートを読み込んで品名や金額をスプレッドシートに自動登録する はじめに OCR(光学文字認識)をgoogleのAPIであるGoogle Cloud Vision APIでできることは知っていたんですが、このAPIはGAS(google app script)ではサービスとして提供されていないのでさっとは使えませんでした。 ですが、サービスとして提供されているDrive APIをつかうこ

                                                      GASでOCRを簡単に使えるんですか!?
                                                    • 2020年出版関連の動向予想 | HON.jp News Blog

                                                      《この記事は約 15 分で読めます(1分で600字計算)》 新年あけましておめでとうございます。 2020年も HON.jp News Blog をどうぞよろしくお願いいたします。 毎年恒例、編集長 鷹野凌による出版関連の動向予想です。 2019年の予想と検証 2019年正月の予想は以下の5つ。自己採点の結果を右端に付けておきました。 メディア自体の信頼度がより一層問われるようになる → ○ 既刊も含めた書籍の電子化率が高まる → △ マンガ表現の多様化が進む → × 学校や図書館向けの電書供給が本格化 → △ オーディオブック市場の拡大が本格化 → ○ 検証の詳細は、大晦日の記事をご覧ください。過去の予想と検証は、以下の通りです。 2018年予想・検証 2017年予想・検証 2016年予想・検証 2015年予想・検証 2014年予想・検証 2013年予想・検証 マクロ環境分析 こういった

                                                        2020年出版関連の動向予想 | HON.jp News Blog
                                                      • 無料でKindleを読み上げるソリューション作ってたら、Audibleならぬオレディブルが出来てしまったが一向にかまわんッ - Qiita

                                                        無料でKindleを読み上げるソリューション作ってたら、Audibleならぬオレディブルが出来てしまったが一向にかまわんッ自然言語処理DeepLearningKindleTextToSpeechOCR はじめに 三体Ⅲが発売されましたが、皆さんもう読みましたか? 僕は発売日当日にKindleで購入したものの、全然読めていません。 このままだと永遠に読み終わらない危機感を感じまして、 読む時間がないならせめて「ながら聴き」したいと思いました。 しかしAudibleはまだ販売されておらず、 販売されたとしても上下合わせてで9,000円とかなり高額です。 また、スマホの設定でも読み上げることは可能ですが、 スマホが使いづらくなるので不採用です。 そこで、お金をかけずにPC上でKindleを読み上げる方法を実現したので紹介します。 特記 途中でKindleのスクリーンショットを行いますが、 スクリ

                                                          無料でKindleを読み上げるソリューション作ってたら、Audibleならぬオレディブルが出来てしまったが一向にかまわんッ - Qiita
                                                        • 【ADHD】iPhoneのリマインダーがすごく便利になっていた!〜私のタスク管理法 - 発達障害ファミリーの幸せライフハック生活

                                                          こんにちは、椋 紅緒(むくべにお)です。 うっかり忘れが多い私はタスク管理用のツールを色々使っていますが、ずっと「シンプルすぎて機能が少ない」と見向きもしていなかったiPhone標準の「リマインダー」が、気づいたら大きな進化を遂げていて驚きました! リマインダー Apple 仕事効率化 無料 日時指定でちゃんと通知が来る! タグ付けできる! 繰り返しタスクを登録してルーチン管理できる リストをテンプレートに保存して使い回せる 場所リマインダーが便利! 電車の降車駅をセット ダイソーをセット タスク管理アプリの使い分け こっそり進化しているiPhone標準アプリ メモ マップ まとめ 関連記事(合わせてお読みください) 日時指定でちゃんと通知が来る! 過集中気味でうっかり忘れが多い私には「Apple Watchに通知が届いてブルブル鳴る」ことがとても重要なのです。 サードパーティ製のタスク管

                                                            【ADHD】iPhoneのリマインダーがすごく便利になっていた!〜私のタスク管理法 - 発達障害ファミリーの幸せライフハック生活
                                                          • CA1994 – 動向レビュー:絵図・古地図のウェブ公開と差別表現への対応の現状 / 奥野吉宏

                                                            絵図・古地図のウェブ公開と差別表現への対応の現状 関西館文献提供課/日本図書館協会図書館の自由委員会:奥野吉宏(おくのよしひろ) はじめに 国立国会図書館(NDL)や国立公文書館に限らず、図書館・博物館・文書館(以下「MLA」)において、資料をデジタル化しウェブ公開することが、規模・館種を問わず広がっている。筆者は、特に京都府立総合資料館(現:京都府立京都学・歴彩館)が同館所蔵の国宝・東寺百合文書をデジタル化し、2014 年 3 月にオープンデータ(クリエイティブ・コモンズ・ライセンスCC BY;E1516参照)としてウェブ公開した(E1561参照)ことが評価(1)され、Library of the Year2014の大賞を受賞(2)したことが、拡大の転機となったと考えている。 この動きは、近代以前に作成された日本の絵図・古地図(以下「絵図」(3))の分野も同様で、NDLのリサーチ・ナビ(

                                                              CA1994 – 動向レビュー:絵図・古地図のウェブ公開と差別表現への対応の現状 / 奥野吉宏
                                                            • Apple M2 MacBook Air レビュー。ファンレス設計の影響と限界を実機で探る(本田雅一) | テクノエッジ TechnoEdge

                                                              ネット社会、スマホなどテック製品のトレンドを分析、コラムを執筆するネット/デジタルトレンド分析家。ネットやテックデバイスの普及を背景にした、現代のさまざまな社会問題やトレンドについて、テクノロジ、ビジネス、コンシューマなど多様な視点から森羅万象さまざまなジャンルを分析。 メカ設計から内蔵カメラ、スピーカー、ディスプレイなど、ありとあらゆる面を最新の設計要素へと更新したAppleの新 MacBook Air (M2搭載モデル)。 14インチ、16インチのMacBook Proで導入したデザインや機能のエッセンスを盛り込んだ上で、M2という最新SoCを搭載し、さらにカラーバリエーションも広いとなれば、円安で以前よりも価格帯が上がっているとはいえ、やはり「このタイミング」と狙っている人が多いのではないだろうか。 すでに発表会から日数が経過し、MacBook ProではM2搭載モデルが出荷済みとあ

                                                                Apple M2 MacBook Air レビュー。ファンレス設計の影響と限界を実機で探る(本田雅一) | テクノエッジ TechnoEdge
                                                              • なぜカスタマーサクセスを重視する企業はAWSを選ぶのか メルカリら3社によるAWS導入のユースケース

                                                                人間が人間らしい仕事に集中できるには 平野未来氏(以下、平野):みなさん、おはようございます。シナモンの平野です。本日はどうぞよろしくお願いいたします。 シナモンがミッションとして掲げているのは「Extend human potential by eliminating repetitive tasks」です。ホワイトカラーには本当にたくさんの面倒な仕事があると思うんですが、そういったお仕事はどんどん人工知能にやってもらって、人間は人間らしい仕事に集中できる世界の実現を目指しています。 私たちの組織のユニークなところは、AIリサーチャーがたくさんいることなんです。現在、グローバルに200人を超えるメンバーがいるんですが、そのうち100人はAIリサーチャーとなっております。 ちなみに、日本全国全世代で見ても、AIリサーチャーというと400人程度しかいませんので、この100人という数字はかなり

                                                                  なぜカスタマーサクセスを重視する企業はAWSを選ぶのか メルカリら3社によるAWS導入のユースケース
                                                                • PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 - ガンマソフト

                                                                  ブログ PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 [PR] 2020/1/7 | OCR PDF Python 今回はPDFを画像ファイル(JPEG、PNG)にPythonで変換する方法をご紹介します。 PDFを画像ファイルに変換するには、通常は有料のAdobe® Acrobat®などのソフトを用いますが、Pythonなら無料で入手できるライブラリで実施できます。 PythonでPDFを画像に変換できれば、PDFの書類をOCRで文字認識したり、多量のPDFファイルをプレビューしやすくするなど、PDFをもっと効率化に利用できるようになります。 本記事の目次 pdf2imageのインストール popplerのダウンロード プロジェクトフォルダ構成 プログラミング(JPEG、PNGへの変換) マルチページのTIFFに変換したい場合 様々に応用できます pdf2imag

                                                                    PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 - ガンマソフト
                                                                  • 【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog

                                                                    研究開発部Architectグループの堤と申します。新任マネージャーとして自身のキャッチアップも兼ねて、研究開発部の技術や成果物について紹介する記事を書いています。 第三弾となる今回は、Sansanの名刺データ化フローの中で使われている弊社が独自開発した名刺に特化した文字認識エンジン「NineOCR」についてご紹介します。 Sansanの名刺データ化フロー NineOCRについては本日プレスリリースが出た通り、データ化範囲が名刺記載の「全項目」 1 となり、いずれの項目でも高い読み取り精度を実現しています。 独自開発の背景 名刺のデータ化では、Emailアドレスや電話番号などを1文字間違えただけでも大問題です。 Sansanでは従来より、オペレーションセンターでの人力処理とコンピュータによる処理をうまく組み合わせて、高精度を維持しつつ、コスト削減やスケーラビリティの両立を実現してきました。

                                                                      【研究開発部の技術】第3回 名刺に特化した文字認識エンジン「NineOCR」 - Sansan Tech Blog
                                                                    • テクノロジーの大波は「オモチャ」のようなものからやってくる

                                                                      いまジリジリと人気の高まってきているのが、市販のラジコンカーにRaspberry Piなどのマイコンをのせて人工知能で走らせる「AIカー」だ。キットを買ってくれば、AIに詳しくない人でも走らせることはできる。そのくせ、AIがどいうものかを知るにはもってこいの奥深さがある。 その代名詞的な存在が、「Donkey Car」というオープンソースのキットだが、昨年11月にはアマゾンが「 DeepRacer」というよく似たラジコンカーを発表(6月のAWS Summit Tokyo 2019では会場でリーグも開かれた)。先日は、NVIDIAが注目のシングルボードコンピュータJetson nanoを搭載した「JetRacer」を発表した(このJetson nanoは以前このコラムでも触れたがNintendo Switchの中身そのものといえるものである)。 これらは、いずれも市販のラジコンカーにマイコン

                                                                        テクノロジーの大波は「オモチャ」のようなものからやってくる
                                                                      • iPadの定番ノートアプリ「GoodNotes 5」が基本無料に、ノート3冊まで

                                                                        手書きノートアプリ「GoodNotes」が最初のノート3冊まで無料で利用できるようになった。 「GoodNotes」はiPadのApp Storeでトップ有料アプリに継続的にランクインしてきた人気アプリだ。Apple Pencilなどデジタルペンを使って快適に手書きでき、なげなわツールで選択して手書きを移動させたり、手書き認識(日本語にも対応)、写真の貼り付け、手書きから図形への自動変換などデジタルノートならではの機能も豊富。手書きとデジタルの長所を活かしたノートを作成できる。 これまで有料アプリだったが、「GoodNotes 5」のバージョン5.9.0のリリース(4月5日)とともにフリーミアムモデル(基本機能などを体験できるように無料提供、フル機能やサービスの継続利用などを有料提供)へ移行した。注目点はフルバージョンを引き続き買い切り型で提供することだ。 iPad向け手書きノートアプリで

                                                                          iPadの定番ノートアプリ「GoodNotes 5」が基本無料に、ノート3冊まで
                                                                        • 生活やビジネスに潜むわずらわしさを解消する「ひとにやさしいAI」を ボイスボット・画像認識・音声合成…それぞれの技術で実現する「これからの当たり前」

                                                                          LINEで働くエンジニアが、各職種別に日々の業務内容や開発体制、働く環境、今後の展望などについて話す「LINE 新卒採用 技術職 コース別説明会」。AIカンパニー AI開発室からは、木田祐介氏が登壇。AI開発室の取り組みと働き方を発表しました。 音声認識や音声信号処理の研究の道を歩んできた木田祐介氏 木田祐介氏:私からは、AIのコースについて説明しようと思います。よろしくお願いします。 最初に自己紹介をいたします。木田と申します。AIカンパニーの中にあるAI開発室のさらに中にある、音声認識技術の研究開発をしているSpeechチームのマネージャーをしています。 経歴としては、音声認識や音声信号処理の研究の道をずっと歩んできました。東芝の研究所に10年ほどいた後、ヤフーに移って、当時は音声認識って車載用でメインに使われていたので、ぜんぜん精度もよくなかった時代から車載用の組み込み型音声認識をや

                                                                            生活やビジネスに潜むわずらわしさを解消する「ひとにやさしいAI」を ボイスボット・画像認識・音声合成…それぞれの技術で実現する「これからの当たり前」
                                                                          • ATMに漂うオワコンの気配、それでも続く機能拡充の意義

                                                                            ATMとは何の略称かご存じだろうか。“A”が「オートマチック」、“M”が「マシン」であることは想像がつくだろう。ただ、“T”が指す意味を知っている方は意外と少ないかもしれない。答えは「テラー」。銀行窓口のことを指す。つまり、店舗での窓口業務を代替する役割が期待されているわけだ。 ATMが日本に姿を現してから40年が経過した。しかし、すべての窓口機能を代替するには至っていない。口座開設を申し込むことはできないし、投資信託を購入するのも難しい。そんななかで、デジタルバンクの足音が近づいてきた。スマートフォン1つで、ほとんどの手続きを完結できる。ATMが得意とする入出金こそできないが、そもそも現金を引き出すのは支払いで使うため。キャッシュレス決済さえあれば事足りる。 正式名称通りの存在になりきれないまま、ATMは役割を終えていくのか。実際、そう見る向きはある。ATMの共同利用やアウトソーシングに

                                                                              ATMに漂うオワコンの気配、それでも続く機能拡充の意義
                                                                            • 印刷された文章を電子データのテキストに変換する方法(OCR) - シロッコの青空ぶろぐ

                                                                              目次 情報カードのための書き写しがめんどい ClipOCR〜人工知能文字認識アプリ GoogleドライブでOCR まとめ 情報カードのための書き写しがめんどい 情報カードを作るために本の重要と思った部分を「Googleスプレッドシート」に書き写していました。私の手書きは文字が汚いうえに速度が遅く、とてもタイプする速度では書けないからです。 そこで、PCで打ち込んでおいて、必要になったらカードに出力すれば良いと考えました。 ただ、これも時間がかかります。 その対策にOCR(Optical character recognition)ソフトを使って本の文字をデジタル文字コードへ変換ししました。 テストしたのはiPhone用の「ClipOCR」と「Googleドライブ」です。 「ClipOCR〜人工知能文字認識アプリ」をApp Storeで Googleドライブ ヘルプ:PDF や写真のファイル

                                                                                印刷された文章を電子データのテキストに変換する方法(OCR) - シロッコの青空ぶろぐ
                                                                              • アマゾンセールで何が欲しい???(2)【妄想カタログ 2023年 6月 2日】 - YANO-T’s blog

                                                                                ブログの前のみなさ~ん、 YANO-T's blogへようこそ。 ※アマゾンタイムセール祭りは終了しました 前回の「アマゾンセールで何が欲しい???」ですが、こちらも好評でした。 ありがとうございます。感謝感謝。 前回はFire TV Cubeとティファールの鍋・フライパンセットをご紹介させて頂きました。 まだ見てないって方、↓↓↓をクリックしてください!! yano-t.net っていうより、このブログをアップするのは6月2日の朝7時、 アマゾンセールのスタートまであと2時間あるんですよね~。 何を書こうかな???って思いながら、アマゾンのサイトを見ながら、 前回ご紹介したピエール瀧さんのYouTube#ユアレコ の新シーズン1回目を見ていました。今回の旅はマレーシアということで、前回ご紹介した私のブログと、ピエール瀧さんのYouTube#ユアレコの新シーズン1回目の放送は下に貼っておき

                                                                                  アマゾンセールで何が欲しい???(2)【妄想カタログ 2023年 6月 2日】 - YANO-T’s blog
                                                                                • PythonとTesseract OCRで文字認識 - Qiita

                                                                                  概要 Pythonの勉強をしている時に良い題材がないかを調べている際、文字認識について興味があったので一緒に使って勉強しようと思いました。 オープンソースで使用可能なOCRはTesseract OCRが優秀だということでこちらを使ってみたいと思います。 Tesseract OCRのインストール 今回はTesseract OCR4.0以降を使用します。 ダウンロード 公式ページ https://github.com/tesseract-ocr/tesseract windowsの場合 自力でコンパイルしても良いが、Windows用インストーラが用意されているのでそちらを実行してインストールを行う。 wikiの「Windows」項目内の「Tesseract at UB Mannheim」をクリック 遷移先のページの32bitもしくは64bitのどちらかをダウンロード。 古いバージョンが欲しい場

                                                                                    PythonとTesseract OCRで文字認識 - Qiita