並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 1662件

新着順 人気順

OCRの検索結果81 - 120 件 / 1662件

  • 無料、独学で機械学習エンジニアになる!~機械学習が学べる無料サイト、書籍~ - Qiita

    こんにちはkamikawaです 今回は無料で利用できる機械学習、データサイエンスに関するサイトや書籍をまとめました 私自身も機械学習プロジェクトに関わった経験があるのですが、ここに載せたサイトや資料を勉強に使っていました 機械学習エンジニアを目指す人必見です 入門者レベル〜応用・発展レベルまで幅広く載せていますレベルは個人の見解です。(あくまでも参考程度に) 日本語のものと英語のものを紹介します 海外の大学の講義もあるので英語の勉強にも使えます 海外でのキャリアを考えている方も必見です 対象読者 機械学習を学びたいけどお金をかけたくない人 独学で機械学習を身につけたい人 機械学習エンジニアになりたい人 発展的な機械学習を学びたい人 日本語 Python 三重大学奥村教授のサイト 機械学習、様々な分析、スクレイピング、データ可視化、地図データ、CV、統計など幅広い分野を扱っている R編もある

      無料、独学で機械学習エンジニアになる!~機械学習が学べる無料サイト、書籍~ - Qiita
    • Evernote firing lots of staff?!

      Any comments on this https://news.ycombinator.com/item?id=36609641&fbclid=IwAR3YRlw36bgKlSR3oV9wKNkaIcC0o8eMWBX2-DWS4TkNYph9uOsp0nHBIrQ ? As I'm using Evernote to OCR and search/organize tens of thousands of pages of historical documents for my dissertation, I'm somewhat concerned about Evernote's long-term viability. I've been a paid user— my wife too, also wrote her diss using Evernote— for year

        Evernote firing lots of staff?!
      • (随時更新)メンバー30人以下くらいの副業もいるチームの社内セキュリティについて - Qiita

        この記事では、以下のようなチームを想定して、お金と手間をできるだけかけずにそこそこセキュリティを向上させることをまとめようと考えています。そんなんじゃだめだ!とか、こういう場合は漏れませんか?というコメント大歓迎です。 想定するチーム 営業やCS、マーケの人など全職種含めると30人前後あるいはそれ以下で、Webサービス(アプリ含む)開発を行っている 副業人材も多く、半数のメンバーは会社支給でないマシンを使っている それらのマシンは他社の業務でも使用されている Macが多めだがWindowsもいる 基本的に業務データはクラウド上にあり、PCローカルにあるのは開発途中のデータ、Biz/バックオフィス系のドキュメント、重たいデザイン系データ程度。自社データセンターや、オフィスネットワークでしかアクセスできないサーバはない。 メインの業務ツールはGoogle WorkspaceとSlackとGit

          (随時更新)メンバー30人以下くらいの副業もいるチームの社内セキュリティについて - Qiita
        • 自動化ツール「Power Automate Desktop」の無償化はMicrosoftの英断 - 阿久津良和のWindows Weekly Report

          レポート 自動化ツール「Power Automate Desktop」の無償化はMicrosoftの英断 - 阿久津良和のWindows Weekly Report Microsoftが米国時間2021年3月2日から開催した「Microsoft Ignite 2012」では、多くの発表があった。そこではMR(複合現実)を拡充する「Microsoft Mesh」やMicrosoft Azure関連の新機能を披露しているが、Windows 10を核とする本連載では何といっても「Power Automate Desktop」の無償化に注目したい。 基本的に「Power Automate」ファミリーは有償ソリューションだが、Windows 10ユーザーは追加料金なしでPower Automate Desktopを利用し、デスクトップやWebブラウザーの操作をRPA(ロボティック プロセス オートメ

            自動化ツール「Power Automate Desktop」の無償化はMicrosoftの英断 - 阿久津良和のWindows Weekly Report
          • 2万字なら、2時間話すくらいの分量だから余裕でいける。 2週間で1年分の学費..

            2万字なら、2時間話すくらいの分量だから余裕でいける。 2週間で1年分の学費(=100万以上するでしょ)を稼ぐと思ったらやる気出ない? ・まずは5日でその本を読む。文字認識しないと言うことだけど、Google翻訳アプリもダメ?無料OCRツールは試した?原書読むより入力するほうが早いなら、最悪手打ちで入力して翻訳にかけたら? ・1日で論文の構成を考える。ここはChatGPTと相談しながらできるでしょ。 ・その翌日、Wordの音声認識を使ってガーっとしゃべっていく。とにかくしゃべる。 ・できた文を直し、切り張り切りはりして、整える。ここに2日かける。 ・時間が余ったら先行研究とかざっとネットで見る。それをちょいちょい引用・追加していく。(ちゃんとそれを残す=アピールポイント) やれたら自信になると思うよ。そして社会人になると、2万字くらいのレポートは1週間ももらえないんだよね。

              2万字なら、2時間話すくらいの分量だから余裕でいける。 2週間で1年分の学費..
            • Microsoft Power Automate DesktopでRPAを実現してみる 🌴 officeの杜 🥥

              自分自身の個人的意見としては、エンドユーザコンピューティングは大いに結構だと思ってるけれど、一方で日本でジリジリと熱さが消えつつある国内の有象無象のRPAについては滅んだほうが良いとも思ってる。理由は後述するとして、本日良いニュースが発表されました。Power Automate Desktopについて追加費用無し無償で利用可能になるとのこと。これは既にあるMicrosoft365のEnterpriseプランなどに標準で利用できてるPower Automateのデスクトップ版のようで、Windows10に標準でついてくるようになるとのこと。 ということで、現時点のMicrosoft365で使えてるPower Automate Desktopを使ってみて、どんな感じなのか?またリリース後にその違いなどをここに記述していこうかなと思っています。また、Seleniumベースのウェブ自動化についても

                Microsoft Power Automate DesktopでRPAを実現してみる 🌴 officeの杜 🥥
              • 患者情報を把握する新システム導入へ 次の感染症に備え 厚労省 | NHK

                新型コロナの患者情報を国や自治体が把握するためのシステムが、当初十分に機能しなかったことから、厚生労働省はことし10月から新たなシステムを導入する方針を固めました。現在は医療機関や保健所が1件1件手入力しており、業務負担になっているほか、入力が滞り把握の遅れにつながったことから、手書きのファックスを自動で読み取ることなどを検討しています。 新型コロナの感染対策に生かすため、国は感染初期のおととし5月から「HER-SYS(ハーシス)」というシステムを導入し、患者の名前や年齢、発症日、症状などの情報を収集しています。 しかし、医療機関や保健所では患者1人に対して当初、およそ120項目を1件1件手入力する必要があり大きな業務負担になっていたほか、入力が滞り、感染状況の把握の遅れにつながっていました。新型コロナ対策を検証する政府の有識者会議も、対策のための根幹の情報が国や専門家に提供されず、デジタ

                  患者情報を把握する新システム導入へ 次の感染症に備え 厚労省 | NHK
                • Evernoteはオワコンか?いや、ちょっと待って - paiza times

                  <この記事の著者> ヨス - Tech Team Journal 業務効率を改善し、タイムパフォーマンスを高める時間最適化の専門家。「単語登録」の便利さを伝える「単語登録エバンジェリスト」。 最近はメモアプリとして「Notion」の勢いがすごいように見えます。SNSを見ていると、今まで「Evernote」を使ってきた人もどんどん移行しているように見えますよね。 そして「Evernoteはオワコン」という声を聞くこともありますが、それは本当でしょうか? 今回は2010年からEvernoteを愛用しているヘビーユーザーのわたしが、現在も使いつづけている理由についてお話しします。 【目次】 なぜEvernoteはオワコンだと言われているのか? (1)大幅な「値上げ」があったから (2)もはや有料版でないと使えないから (3)日本法人が解散したから それでもEvernoteを使いつづける理由 (1

                    Evernoteはオワコンか?いや、ちょっと待って - paiza times
                  • 自動車工場のガロア体

                    その誕生を地元新聞も経済新聞も記事にしなかった。2年後、『コードの情報を白黒の点の組み合わせに置き換える』と最下段のベタ記事で初めて紹介された時、その形を思い浮かべることができる読者はいなかった。いま、説明の必要すらない。QRコードはなぜ開発され、どう動くのだろうか。 QRコードは、自動車生産ラインの切実な要請と非自動車部門の技術者の「世界標準の発明をしたい」という野心の微妙な混交の下、1990年代前半の日本電装(現デンソー)で開発された。 トヨタグループの生産現場では、部品名と数量の記された物理的なカンバンが発注書、納品書として行き来することで在庫を管理する。そのデータ入力を自動化するバーコード(NDコード)を開発したのがデンソーだ。 バブル全盛の1990年ごろ、空前の生産台数、多様な車種・オプションに応えるため、部品も納入業者も急激に増え、NDコードが限界を迎えていた。63桁の数字しか

                      自動車工場のガロア体
                    • リングフィットアドベンチャーの記録で友達と競える仕組みを作った

                      🐣 はじめに おうちで気軽にフィットネスができる「リングフィットアドベンチャー」。 一人でがんばるのもいいけどみんなで競い合ったほうがもっと楽しいし継続できるよね!ってことで、そんな仕組みを作りました。 具体的には 運動結果のSlack通知(「今日もちゃんと運動して偉い!」) 運動結果データのログ保存(いつ・だれが・どれくらい運動したか) ログの集計・可視化・通知(「8月のカロリー部門1位は○さんでした!」) を自動化しています。 運動結果のスクショをTwitterに投稿するだけで参加できます。 この仕組みを作ってから、今では10人くらいでわちゃわちゃ楽しくやってます。 また後述しますが、すべて無料枠で運用しています。 主な機能 Twitterの投稿を検知してSlackに通知します。 毎週月曜日に進捗をお知らせします。 月初に前月のサマリーを投稿します。(テキストだけ人力🤫) 🎯 技

                        リングフィットアドベンチャーの記録で友達と競える仕組みを作った
                      • 専用ブラウザでの5ちゃんねる閲覧が不可能に、JaneStyleなど一部は「Talk」への対応を開始

                        巨大掲示板サイト「5ちゃんねる」(旧2ちゃんねる)が、サードパーティー製専用ブラウザで軒並み閲覧不可能になる事態となっています。すでに、主要な専用ブラウザの1つだったJane Styleは5ちゃんねる(5ch.net)への対応を終了し、「Talk」(talk.jp)という新しい掲示板の専用ブラウザに姿を変えています。 5ちゃんねる https://5ch.net/ Jane Style公式サイトは以下のように、すでに「Talk専用ブラウザ」を名乗っています。 Talk専用ブラウザ 「Jane Style」 http://janesoft.net/janestyle/ 更新履歴を見ると2023年7月10日公開のVer5.00でTalkに対応、5ch.netのサポートを終了しています。 iOS向けの「Twinkle」も同様の対応で、起動するとアップデートを求められ、アップデート後、継続使用する

                          専用ブラウザでの5ちゃんねる閲覧が不可能に、JaneStyleなど一部は「Talk」への対応を開始
                        • 高精度で話題の機械翻訳サービス「DeepL」を使ってゲーム内の文章をその場で翻訳。日本語未対応ゲームの強い味方「OCR2DeepL」が配信中

                          2020年3月、機械翻訳サービス「DeepL」が日本語に対応し、これまでスタンダードとされてきた「Google翻訳」以上の翻訳精度だとして大きな話題となった。DeepLにはデスクトップアプリ版も存在しており、そのアプリ版を使ってゲームの字幕の翻訳を補助する便利なソフトウェア「OCR2DeepL」が公開されている。 制作したのはWiNCHaN氏。「OCR2DeepL」は「OCR」(光学文字認識)ソフトとDeepLアプリを仲介し、コピーした文字列をDeepLに送る。簡単に言えば、画面に映った文字をそのままDeepLで翻訳できるという優れものだ。プレイヤーはゲームプレイ中に気になる文章があれば、マウスでその字幕が映っている範囲を選択するだけでよい。 OCR2DeepLの使用例 実際にテストしてみよう。OCRを使用するため、アクションゲームや字幕がすぐに消えてしまうゲームには使いづらい。まず試して

                            高精度で話題の機械翻訳サービス「DeepL」を使ってゲーム内の文章をその場で翻訳。日本語未対応ゲームの強い味方「OCR2DeepL」が配信中
                          • AI開発の新たなパラダイム「基盤モデル」とは

                            さて、視覚・言語を扱う基盤モデルとしては、2021年の CLIP がブレイクスルーでした。CLIPはテキストと画像を同じ特徴空間に写像する2つのエンコーダからなります。CLIPを使うと、次のようにして任意の画像分類問題を追加の学習なしで解くことができます。まず、各候補クラスを文章の形式(例:「犬の写真」)にした後、テキストエンコーダに入力します。次に、分類したい画像を画像エンコーダに入力します。最後に、画像から得られたベクトルと候補クラスたちから得られた複数のベクトルとのコサイン類似度を計算し、最も類似度が高いクラスを出力結果とします。 CLIPによるゼロショット画像分類の方法。OpenAI Blogより引用 CLIPは画像とテキストというモードの異なる情報を意味的な近さによって結びつけることを可能にしました。CLIPを教師のようにして使うことで、テキストから画像を生成するモデルを訓練する

                              AI開発の新たなパラダイム「基盤モデル」とは
                            • 知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!

                              令和の時代になっても、手渡しで配られる小学校のプリント、届くFAXはWordで書いたものをわざわざ印刷したもの、メールに添付された資料は印刷したエクセルをPDF化したもの…もううんざりですよね。 テキストのデータでぽんともらえれば早く済む仕事も、画像データで来てしまうともう一度パソコンに打ち直す必要があります。普段パソコンで仕事をしている人なら、このような事態に何度か直面したことがあるでしょう。 もちろん、「テキストデータで送って!」と言えれば、何の問題もありません。しかし相手が上司やお客さんだとなかなか言えませんし、勇気を出して伝えても、「テキストデータ?きょーゆーふぉるだ?よくわかんないけど、データは送ったよ☆」となることが多く、この悩みは尽きそうにありません。 そんなときは、画像データをテキストデータに変換できる「OCR」がおすすめです!OCRソフトには色々あり、一昔前は有償のものが

                                知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!
                              • 「画面上の英文を読み取ってそのまま翻訳できます」―ゲーム向け汎用翻訳支援ツールPCOT作者ぬるっぽ氏インタビュー【有志日本語化の現場から】 | Game*Spark - 国内・海外ゲーム情報サイト

                                海外のPCゲームをプレイする際にお世話になる方も多い有志日本語化。今回は視点を変え、人間による翻訳ではなく機械翻訳の利便性を高めるアプローチに迫ります。 日本語化とは海外のゲームを日本語で遊べるようにすることです。その中でも、デベロッパーやパブリッシャーによる公式の日本語化ではない、ユーザーによる非公式な日本語化を有志日本語化(有志翻訳)と呼びます。一般的にボランティアで行われ、成果物は無償で配布されます。 連載第15回は、ゲーム画面の英語を読み取り自動的に翻訳するフリーソフト「PCOT」の作者ぬるっぽ氏に話を訊きました。 ヌルポインターストライク (翻訳支援ツールPCOTの配布サイト) PCOTの機能紹介 その1(基本機能) PCOTの使い方は簡単。翻訳したいゲームを選択し、好きなタイミングで位置を指定するだけです。すると自動的に英文が読み取られ、日本語に翻訳されて表示されます。 とある

                                  「画面上の英文を読み取ってそのまま翻訳できます」―ゲーム向け汎用翻訳支援ツールPCOT作者ぬるっぽ氏インタビュー【有志日本語化の現場から】 | Game*Spark - 国内・海外ゲーム情報サイト
                                • 古文書を解読できるiOSアプリ、凸版印刷が無料配信 手書きや木版のくずし字に対応 解読率は90%

                                  凸版印刷(東京都文京区)は6月1日、くずし字解読アプリ「古文書カメラ」(iOS)の配信を始めた。AI-OCR技術を活用したアプリで、スマートフォンで撮影したくずし字をその場で解析できる。アプリのインストールは無料、解読機能は、1日に10回まで利用可能。 書簡などの手書きと木版印刷で作られた版本、それぞれのくずし字に対応したAI-OCRエンジンを搭載しており、解読率は90%に及ぶという。AIが全ての文字を自動で検出し、解読する「フルオートモード」と、文字候補を提案することでさらに詳細な解読を可能にする「範囲選択モード」を備える。 もしAIの解読結果が間違っていた場合、ユーザーが修正できる。修正内容はAIが再学習し、解読精度を向上させられるという。解読結果は画像とテキストデータで保存可能。 同社ではこれまでも古文書解読事業を進めており、今回のアプリもその一環。古文書のほとんどはくずし字で書かれ

                                    古文書を解読できるiOSアプリ、凸版印刷が無料配信 手書きや木版のくずし字に対応 解読率は90%
                                  • 紙の書類を高精度にテキストデータ化できる無料Webサービス『Free Online OCR』【今日のライフハックツール】 | ライフハッカー・ジャパン

                                    三井住友カード ゴールド(NL)のデメリットは?メリットない・いらないは勘違い【年会費無料になる100万円修行のコツ】

                                      紙の書類を高精度にテキストデータ化できる無料Webサービス『Free Online OCR』【今日のライフハックツール】 | ライフハッカー・ジャパン
                                    • 深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

                                      ■イベント 
:【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要 タイトル:深層学習時代の文字認識とその周辺 発表者: 
技術本部 DSOC R&D研究員  宮本 優一 ▼Twitter https://twitter.com/SansanRandD

                                        深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
                                      • 簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部

                                        D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。 ・AI OCR は Google vs Microsoft の構図。 両者精度高。 ・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。 ・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。 スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect

                                          簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部
                                        • 古文書などの「くずし字」解読が簡単にできる一般向けAI-OCRアプリ、凸版印刷が開発。2023年提供予定

                                            古文書などの「くずし字」解読が簡単にできる一般向けAI-OCRアプリ、凸版印刷が開発。2023年提供予定 
                                          • [スタパ齋藤のApple野郎] iPhoneがOCRスキャナーになる! 2月に爆誕した神アプリで紙の文字をテキスト化!!!

                                              [スタパ齋藤のApple野郎] iPhoneがOCRスキャナーになる! 2月に爆誕した神アプリで紙の文字をテキスト化!!!
                                            • 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

                                              科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem

                                                数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
                                              • 情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ

                                                情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ 2023年12月20日 株式会社LayerX 機械学習・データ部 機械学習グループ マネージャー 松村 優也 1993年生まれ。2018年3月、京都大学大学院情報学研究科 社会情報学専攻修士課程修了。在学中の起業経験を経て、新卒でウォンテッドリー株式会社に入社、推薦システムチームの立ち上げに関わる。2021年にはWantedly VisitのPdM、開発組織のEMを兼任。2022年9月に株式会社LayerXに機械学習エンジニアとして入社。2023年には機械学習チームのリーダー、現職に就任。 X(Twitter) Speakerdeck 技術や業界など仕事についての情報収集の基盤として多くのエンジニアを支えていたTwitter(現X)が、以前とは異なる姿となってゆく今、必要な情報を過不足なく

                                                  情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ
                                                • 凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発

                                                  2022/11/11 凸版印刷、明治期から昭和初期の手書き文字を解読する AI-OCRを日本で初めて開発

                                                    凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発
                                                  • PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記

                                                    PDFからテキストを取り出すのは、意外と大変です。 それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵(「グリフ」)をコンピューターで扱えるような「文字」にする方法です。 これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出す このうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法 この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。 これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ(文字の形)をページ上に表示するための汎用の仕組

                                                      PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記
                                                    • Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし | Ledge.ai

                                                      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                        Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし | Ledge.ai
                                                      • なぜDXは分かりにくいのか? なぜ3種類のDXが生まれたのか? ビジネスパーソンのためのDX入門セミナー【セミナーレポート】 | Aidemy Business

                                                        Aidemy Business > AI-CAN > なぜDXは分かりにくいのか? なぜ3種類のDXが生まれたのか? ビジネスパーソンのためのDX入門セミナー【セミナーレポート】 この記事は2020年12月23日に開催されたWebセミナー「DXを徹底解説!ビジネスパーソンのためのDX入門セミナー」のレポートです。 ※記事化のために一部を編集しています。 2020年12月23日、“中山ところてん”として知られる株式会社NextInt代表の中山心太氏と、株式会社アイデミーの共催セミナーが開催されました。Aidemy Businessの新講座「ビジネスパーソンのためのDX入門講座」を制作された中山氏が、そのエッセンスを凝縮してお話しくださいました。進行は、アイデミーで開発本部コンテンツ部長を務める登坂直矢です。 中山ところてん(中山心太)氏 株式会社NextInt代表 著書: 『仕事ではじめる機

                                                        • 分厚いハードカバーばかり持っている人間が家の本の電子書籍化に手を出した経過報告 - 基本読書

                                                          最近家の本の電子書籍化に着手している。もともと僕は本は大量に買うが、それをいつまでもとっておくのではなく、定期的に売るか捨てるかしていた。理由は単純で、家が狭く、引っ越しが多いからだ。転職も多く、乗り物酔いがひどく、電車に乗っただけで吐きそうになるので、毎回会社の徒歩圏内に引っ越す必要があるのである。 一人暮らしなので当然ワンルームだ。そうすると、本を何千冊も置いておくスペースは存在しないし、持ち運ぶのも非効率だ。なので、泣く泣く本たちを処分する。過去の本を参照する必要がある時も多いが’、そういう時は諦めて2000円の本だろうが、古書で5000円になっていようが、諦めて買い直していた。その再購入費用はだいたい年間5万〜10万程度で、場所代・保管費よりは安い、という塩梅であった。 ところが、先日SF年間ベスト記事で告知を出したが、いまSFについての本を書いていて、大量の本を買い直したり資料を

                                                            分厚いハードカバーばかり持っている人間が家の本の電子書籍化に手を出した経過報告 - 基本読書
                                                          • 手書き文字を認識できるAIを無償公開 自社サービスでAI OCRが利用可能に | Ledge.ai

                                                            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                              手書き文字を認識できるAIを無償公開 自社サービスでAI OCRが利用可能に | Ledge.ai
                                                            • GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

                                                              4 September 2023 - Version 1.7.1 Fix several compatibilities 25 May 2023 - Version 1.7.0 Add Apple Silicon support (thanks@rayeesoft and @ArtemBernatskyy, see PR) Fix several compatibilities 15 September 2022 - Version 1.6.2 Add CPU support for DBnet DBnet will only be compiled when users initialize DBnet detector. 1 September 2022 - Version 1.6.1 Fix DBnet path bug for Windows Add new built-in mo

                                                                GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.
                                                              • 日本語特化のAI文字起こしサービス 1時間の音声を5分で文字化、句読点も自動で調整

                                                                日本語に特化した自然言語処理技術を用いることで、句読点の位置を自動で調整し、自然な日本語のテキストを出力できるという。会議の議事録や会話の記録、取材内容の文字起こしなどの活用を想定する。 今後は録画した映像データを文字起こしする機能や、文字起こし結果を表示する画面でテキストを編集できる機能を採用するとしている。 関連記事 Microsoft、「Word for Web」にトランスクリプト(文字起こし)機能を追加 Web版のMicrosoft Wordに、音声をテキストに変換する機能「トランスクリプト」が追加された。まだ対応するのは英語のみだが、対応言語を拡大していく計画。複数の話者を区別してテキスト化し、テキストはそのままWordのドキュメントに挿入できる。 DropboxとZoomが連携強化 ビデオ会議の録音・録画・文字起こしをDropbox上に保存可能に DropboxとZoomの連携

                                                                  日本語特化のAI文字起こしサービス 1時間の音声を5分で文字化、句読点も自動で調整
                                                                • 「LLM」を活用したプロダクト開発に必要な能力とは何か “機械学習の民主化”でますます注目される「MLPdM」の重要性

                                                                  大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント第二弾。今回のテーマは「大規模言語モデルがつくる新しい顧客体験」。ここで登壇したのは、株式会社LayerXの松村優也氏。機械学習の民主化とMLPdMの重要性について発表しました。 LayerX社・機械学習チームのマネージャーの松村優也氏 松村優也氏:それでは、LayerXの松村優也が「機械学習エンジニアから見るプロダクト開発におけるLLM」を副題として、「機械学習の民主化とMLPdMの重要性」というタイトルで10分お話しします。お願いします。 簡単な自己紹介ですが、あらためて、松村です。(スライドの)右上の黒いアイコンでよくSNSをやっています。「Twitter」などのIDはご覧のとおりです。 バックグラウンド的には、もともと京都大学で情報検

                                                                    「LLM」を活用したプロダクト開発に必要な能力とは何か “機械学習の民主化”でますます注目される「MLPdM」の重要性
                                                                  • 【2024年】AWS全サービスまとめ | DevelopersIO

                                                                    こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。 こんにちは。サービス開発室の武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個 です。 まとめるにあ

                                                                      【2024年】AWS全サービスまとめ | DevelopersIO
                                                                    • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                                                                      こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                                                                        Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                                                                      • Google Drive、OneDrive、Box、Dropbox――進化を続ける4大クラウドストレージの機能を徹底解説

                                                                        Google Drive、OneDrive、Box、Dropbox――進化を続ける4大クラウドストレージの機能を徹底解説(1/2 ページ) Google DriveやMicrosoft OneDrive、さらにはDropboxやBoxなどのクラウドストレージは、今やかなりなじみのあるクラウドサービスだ。ストレージ領域がクラウド上にあれば、PCやスマートフォンなど多様なデバイスからデータを保管でき、場所を選ばずアクセスできる。クラウドストレージは当初、単価当たりのストレージ容量の大きさやデータ同期スピードの速さが優位性だった。その後はデータ共有機能や他のアプリケーションとの連携、コンプライアンス対応機能などが追加され、進化を続けている。 では、これら代表的なクラウドストレージの特徴を探っていこう。 MicrosoftやGoogleはコンプライアンスを確保できる企業向け機能を強化 OneDri

                                                                          Google Drive、OneDrive、Box、Dropbox――進化を続ける4大クラウドストレージの機能を徹底解説
                                                                        • PDF を Gyazo に展開して Scrapbox の記事にして全文検索する - Diary

                                                                          PDF を Gyazo に展開して Scrapbox の記事にして全文検索する という試みについてです。 まず PDF を Gyazo に展開して Scrapbox の記事にするということですが、これについてブラウザ上で簡単に動くツールを実装しました。 https://ssig33.github.io/pdftoscrapbox/ おそろしく素朴な見た目ですがとりあえず動きます。Chrome や Edge に Tamper Monkey (試してないけど Firefox と Greasemonkey でも動くんじゃないかな)を入れて、 input に Scrapbox のプロジェクト名を入れて user.js をインストールした上で赤いところに PDFをドラッグ&ドロップすると、 PDF.js で PDF でレンダリングした上で全てのページを Gyazo にアップロードして Scrapbo

                                                                          • 〜OCR戦記〜適格事業者登録番号との戦い🔥🔥🔥 - LayerX エンジニアブログ

                                                                            この記事はLayerXテックアドカレ2023の5日目の記事です。 昨日はmakogaさんがEngineering Career Ladderを作るときに気をつけたこと 其の一を書いてくれました。 次回はyuya-takeyamaさんがMicrosoft Graph APIについて書いてくれます!乞うご期待! こんにちは、機械学習を通じて誰かをラクにしたい yakipuです。 今回は、10月から始まったインボイス制度に伴う適格請求書発行事業者登録番号(以下「登録番号」と表記します)のOCR読み取りの戦いについて記したいと思います。 インボイス制度は、売手が買手に対して正確な税率や消費税額を示す適格請求書(インボイス)を交付することで、買手が仕入税額控除の適用を受けるために必要な制度です。売手側は登録事業者として登録番号などが記載されたインボイスを交付し、買手側はインボイスを保存する必要があり

                                                                              〜OCR戦記〜適格事業者登録番号との戦い🔥🔥🔥 - LayerX エンジニアブログ
                                                                            • OCR機能や記号入力補助ツールを強化した「PowerToys 0.66.0」がリリース/自己完結型「.NET 7」アプリとなりランタイム管理も簡素化、リソース消費も削減

                                                                                OCR機能や記号入力補助ツールを強化した「PowerToys 0.66.0」がリリース/自己完結型「.NET 7」アプリとなりランタイム管理も簡素化、リソース消費も削減
                                                                              • 画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー

                                                                                画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog

                                                                                  画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
                                                                                • 国会図書館デジコレから全文テキストをダウンロードするだけのブックマークレット - ronbun yomu

                                                                                  リニューアルに際して、ブックマークレットの箇所も更新しました。(2022/12/21) 使えなくなってたのでまた更新しました。(2023/01/05) これは何の記事 国会図書館次世代デジタルライブラリーで古典籍が検索できるようになって、いよいよすごいことになっている。 / 古典籍資料の全文検索が可能になります! \ 11月1日(火)に、実験システム #次世代デジタルライブラリー に古典籍資料6万点のOCR全文テキストデータを追加します。これまでの明治以降の図書に加え、江戸期以前のくずし字等資料の全文検索も可能となります。https://t.co/9KT1CdaSYa pic.twitter.com/aOz7OmyWew— 国立国会図書館 NDL (@NDLJP) 2022年10月26日 まじでいいんですか? 次世代デジタルライブラリー上でテキストのダウンロードもできる(右下の「この資料の

                                                                                    国会図書館デジコレから全文テキストをダウンロードするだけのブックマークレット - ronbun yomu