本文「OCR」を検索 - はてなブックマーク

81 - 120 件 / 1662件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

OCRの検索結果81 - 120 件 / 1662件

無料、独学で機械学習エンジニアになる！~機械学習が学べる無料サイト、書籍~ - Qiita
- 123 users
- qiita.com/KamikawaTakato
- テクノロジー
- 2021/03/05
こんにちはkamikawaです今回は無料で利用できる機械学習、データサイエンスに関するサイトや書籍をまとめました私自身も機械学習プロジェクトに関わった経験があるのですが、ここに載せたサイトや資料を勉強に使っていました機械学習エンジニアを目指す人必見です入門者レベル〜応用・発展レベルまで幅広く載せていますレベルは個人の見解です。(あくまでも参考程度に) 日本語のものと英語のものを紹介します海外の大学の講義もあるので英語の勉強にも使えます海外でのキャリアを考えている方も必見です対象読者機械学習を学びたいけどお金をかけたくない人独学で機械学習を身につけたい人機械学習エンジニアになりたい人発展的な機械学習を学びたい人日本語 Python 三重大学奥村教授のサイト機械学習、様々な分析、スクレイピング、データ可視化、地図データ、CV、統計など幅広い分野を扱っている R編もある
Evernote firing lots of staff?!
- 118 users
- discussion.evernote.com
- テクノロジー
- 2023/07/08
Any comments on this https://news.ycombinator.com/item?id=36609641&fbclid=IwAR3YRlw36bgKlSR3oV9wKNkaIcC0o8eMWBX2-DWS4TkNYph9uOsp0nHBIrQ ? As I'm using Evernote to OCR and search/organize tens of thousands of pages of historical documents for my dissertation, I'm somewhat concerned about Evernote's long-term viability. I've been a paid user— my wife too, also wrote her diss using Evernote— for year
(随時更新)メンバー30人以下くらいの副業もいるチームの社内セキュリティについて - Qiita
- 115 users
- qiita.com/ku_suke
- テクノロジー
- 2021/10/23
この記事では、以下のようなチームを想定して、お金と手間をできるだけかけずにそこそこセキュリティを向上させることをまとめようと考えています。そんなんじゃだめだ！とか、こういう場合は漏れませんか？というコメント大歓迎です。想定するチーム営業やCS、マーケの人など全職種含めると30人前後あるいはそれ以下で、Webサービス（アプリ含む）開発を行っている副業人材も多く、半数のメンバーは会社支給でないマシンを使っているそれらのマシンは他社の業務でも使用されている Macが多めだがWindowsもいる基本的に業務データはクラウド上にあり、PCローカルにあるのは開発途中のデータ、Biz/バックオフィス系のドキュメント、重たいデザイン系データ程度。自社データセンターや、オフィスネットワークでしかアクセスできないサーバはない。メインの業務ツールはGoogle WorkspaceとSlackとGit
- セキュリティ
- あとで読む
- security
- 開発
- チーム
- システム
- qiita
- development
- Google
自動化ツール「Power Automate Desktop」の無償化はMicrosoftの英断 - 阿久津良和のWindows Weekly Report
- 112 users
- news.mynavi.jp
- テクノロジー
- 2021/03/07
レポート自動化ツール「Power Automate Desktop」の無償化はMicrosoftの英断 - 阿久津良和のWindows Weekly Report Microsoftが米国時間2021年3月2日から開催した「Microsoft Ignite 2012」では、多くの発表があった。そこではMR（複合現実）を拡充する「Microsoft Mesh」やMicrosoft Azure関連の新機能を披露しているが、Windows 10を核とする本連載では何といっても「Power Automate Desktop」の無償化に注目したい。基本的に「Power Automate」ファミリーは有償ソリューションだが、Windows 10ユーザーは追加料金なしでPower Automate Desktopを利用し、デスクトップやWebブラウザーの操作をRPA（ロボティックプロセスオートメ
2万字なら、2時間話すくらいの分量だから余裕でいける。 2週間で1年分の学費..
- 107 users
- anond.hatelabo.jp
- テクノロジー
- 2024/01/05
2万字なら、2時間話すくらいの分量だから余裕でいける。 2週間で1年分の学費（＝100万以上するでしょ）を稼ぐと思ったらやる気出ない？・まずは5日でその本を読む。文字認識しないと言うことだけど、Google翻訳アプリもダメ？無料OCRツールは試した？原書読むより入力するほうが早いなら、最悪手打ちで入力して翻訳にかけたら？・1日で論文の構成を考える。ここはChatGPTと相談しながらできるでしょ。・その翌日、Wordの音声認識を使ってガーっとしゃべっていく。とにかくしゃべる。・できた文を直し、切り張り切りはりして、整える。ここに2日かける。・時間が余ったら先行研究とかざっとネットで見る。それをちょいちょい引用・追加していく。（ちゃんとそれを残す＝アピールポイント）やれたら自信になると思うよ。そして社会人になると、2万字くらいのレポートは1週間ももらえないんだよね。
- 増田
- 文章
- あとで読む
- chatGPT
- 教育
- 大学
- 仕事
Microsoft Power Automate DesktopでRPAを実現してみる 🌴 officeの杜 🥥
- 107 users
- officeforest.org
- テクノロジー
- 2021/03/03
自分自身の個人的意見としては、エンドユーザコンピューティングは大いに結構だと思ってるけれど、一方で日本でジリジリと熱さが消えつつある国内の有象無象のRPAについては滅んだほうが良いとも思ってる。理由は後述するとして、本日良いニュースが発表されました。Power Automate Desktopについて追加費用無し無償で利用可能になるとのこと。これは既にあるMicrosoft365のEnterpriseプランなどに標準で利用できてるPower Automateのデスクトップ版のようで、Windows10に標準でついてくるようになるとのこと。ということで、現時点のMicrosoft365で使えてるPower Automate Desktopを使ってみて、どんな感じなのか？またリリース後にその違いなどをここに記述していこうかなと思っています。また、Seleniumベースのウェブ自動化についても
患者情報を把握する新システム導入へ次の感染症に備え厚労省 | NHK
- 105 users
- www3.nhk.or.jp
- 政治と経済
- 2022/06/21
新型コロナの患者情報を国や自治体が把握するためのシステムが、当初十分に機能しなかったことから、厚生労働省はことし10月から新たなシステムを導入する方針を固めました。現在は医療機関や保健所が1件1件手入力しており、業務負担になっているほか、入力が滞り把握の遅れにつながったことから、手書きのファックスを自動で読み取ることなどを検討しています。新型コロナの感染対策に生かすため、国は感染初期のおととし5月から「HER-SYS（ハーシス）」というシステムを導入し、患者の名前や年齢、発症日、症状などの情報を収集しています。しかし、医療機関や保健所では患者1人に対して当初、およそ120項目を1件1件手入力する必要があり大きな業務負担になっていたほか、入力が滞り、感染状況の把握の遅れにつながっていました。新型コロナ対策を検証する政府の有識者会議も、対策のための根幹の情報が国や専門家に提供されず、デジタ
- COVID-19
- 医療
- システム
- 政治
- medical
- 労働
- あとで読む
Evernoteはオワコンか？いや、ちょっと待って - paiza times
- 105 users
- paiza.hatenablog.com
- テクノロジー
- 2024/05/06
＜この記事の著者＞ヨス - Tech Team Journal 業務効率を改善し、タイムパフォーマンスを高める時間最適化の専門家。「単語登録」の便利さを伝える「単語登録エバンジェリスト」。最近はメモアプリとして「Notion」の勢いがすごいように見えます。SNSを見ていると、今まで「Evernote」を使ってきた人もどんどん移行しているように見えますよね。そして「Evernoteはオワコン」という声を聞くこともありますが、それは本当でしょうか？今回は2010年からEvernoteを愛用しているヘビーユーザーのわたしが、現在も使いつづけている理由についてお話しします。【目次】なぜEvernoteはオワコンだと言われているのか？（1）大幅な「値上げ」があったから（2）もはや有料版でないと使えないから（3）日本法人が解散したからそれでもEvernoteを使いつづける理由（1
自動車工場のガロア体
- 101 users
- static.chunichi.co.jp
- テクノロジー
- 2022/06/10
その誕生を地元新聞も経済新聞も記事にしなかった。２年後、『コードの情報を白黒の点の組み合わせに置き換える』と最下段のベタ記事で初めて紹介された時、その形を思い浮かべることができる読者はいなかった。いま、説明の必要すらない。ＱＲコードはなぜ開発され、どう動くのだろうか。ＱＲコードは、自動車生産ラインの切実な要請と非自動車部門の技術者の「世界標準の発明をしたい」という野心の微妙な混交の下、1990年代前半の日本電装（現デンソー）で開発された。トヨタグループの生産現場では、部品名と数量の記された物理的なカンバンが発注書、納品書として行き来することで在庫を管理する。そのデータ入力を自動化するバーコード（ＮＤコード）を開発したのがデンソーだ。バブル全盛の1990年ごろ、空前の生産台数、多様な車種・オプションに応えるため、部品も納入業者も急激に増え、ＮＤコードが限界を迎えていた。63桁の数字しか
リングフィットアドベンチャーの記録で友達と競える仕組みを作った
- 95 users
- zenn.dev/24
- 暮らし
- 2021/09/10
🐣 はじめにおうちで気軽にフィットネスができる「リングフィットアドベンチャー」。一人でがんばるのもいいけどみんなで競い合ったほうがもっと楽しいし継続できるよね！ってことで、そんな仕組みを作りました。具体的には運動結果のSlack通知（「今日もちゃんと運動して偉い！」）運動結果データのログ保存（いつ・だれが・どれくらい運動したか）ログの集計・可視化・通知（「8月のカロリー部門１位は○さんでした！」）を自動化しています。運動結果のスクショをTwitterに投稿するだけで参加できます。この仕組みを作ってから、今では10人くらいでわちゃわちゃ楽しくやってます。また後述しますが、すべて無料枠で運用しています。主な機能 Twitterの投稿を検知してSlackに通知します。毎週月曜日に進捗をお知らせします。月初に前月のサマリーを投稿します。（テキストだけ人力🤫） 🎯 技
専用ブラウザでの5ちゃんねる閲覧が不可能に、JaneStyleなど一部は「Talk」への対応を開始
- 91 users
- gigazine.net
- 世の中
- 2023/07/10
巨大掲示板サイト「5ちゃんねる」(旧2ちゃんねる)が、サードパーティー製専用ブラウザで軒並み閲覧不可能になる事態となっています。すでに、主要な専用ブラウザの1つだったJane Styleは5ちゃんねる(5ch.net)への対応を終了し、「Talk」(talk.jp)という新しい掲示板の専用ブラウザに姿を変えています。５ちゃんねる https://5ch.net/ Jane Style公式サイトは以下のように、すでに「Talk専用ブラウザ」を名乗っています。 Talk専用ブラウザ「Jane Style」 http://janesoft.net/janestyle/ 更新履歴を見ると2023年7月10日公開のVer5.00でTalkに対応、5ch.netのサポートを終了しています。 iOS向けの「Twinkle」も同様の対応で、起動するとアップデートを求められ、アップデート後、継続使用する
- ブラウザ
- あとで読む
- 5ch
- 2ch
- webサービス
- ネット
- ネタ
高精度で話題の機械翻訳サービス「DeepL」を使ってゲーム内の文章をその場で翻訳。日本語未対応ゲームの強い味方「OCR2DeepL」が配信中
- 89 users
- news.denfaminicogamer.jp
- アニメとゲーム
- 2020/03/31
2020年3月、機械翻訳サービス「DeepL」が日本語に対応し、これまでスタンダードとされてきた「Google翻訳」以上の翻訳精度だとして大きな話題となった。DeepLにはデスクトップアプリ版も存在しており、そのアプリ版を使ってゲームの字幕の翻訳を補助する便利なソフトウェア「OCR2DeepL」が公開されている。制作したのはWiNCHaN氏。「OCR2DeepL」は「OCR」（光学文字認識）ソフトとDeepLアプリを仲介し、コピーした文字列をDeepLに送る。簡単に言えば、画面に映った文字をそのままDeepLで翻訳できるという優れものだ。プレイヤーはゲームプレイ中に気になる文章があれば、マウスでその字幕が映っている範囲を選択するだけでよい。 OCR2DeepLの使用例実際にテストしてみよう。OCRを使用するため、アクションゲームや字幕がすぐに消えてしまうゲームには使いづらい。まず試して
- 翻訳
- DeepL
- OCR
- ゲーム
- 言語
- ソフトウェア
- あとで読む
- 文章
- AI
- 英語
AI開発の新たなパラダイム「基盤モデル」とは
- 89 users
- blog.recruit.co.jp
- テクノロジー
- 2022/07/04
さて、視覚・言語を扱う基盤モデルとしては、2021年の CLIP がブレイクスルーでした。CLIPはテキストと画像を同じ特徴空間に写像する2つのエンコーダからなります。CLIPを使うと、次のようにして任意の画像分類問題を追加の学習なしで解くことができます。まず、各候補クラスを文章の形式（例：「犬の写真」）にした後、テキストエンコーダに入力します。次に、分類したい画像を画像エンコーダに入力します。最後に、画像から得られたベクトルと候補クラスたちから得られた複数のベクトルとのコサイン類似度を計算し、最も類似度が高いクラスを出力結果とします。 CLIPによるゼロショット画像分類の方法。OpenAI Blogより引用 CLIPは画像とテキストというモードの異なる情報を意味的な近さによって結びつけることを可能にしました。CLIPを教師のようにして使うことで、テキストから画像を生成するモデルを訓練する
知らなくて損してた！OCRがGoogleドライブで手軽にできる方法！
- 87 users
- aizine.ai
- テクノロジー
- 2019/10/13
令和の時代になっても、手渡しで配られる小学校のプリント、届くFAXはWordで書いたものをわざわざ印刷したもの、メールに添付された資料は印刷したエクセルをPDF化したもの…もううんざりですよね。テキストのデータでぽんともらえれば早く済む仕事も、画像データで来てしまうともう一度パソコンに打ち直す必要があります。普段パソコンで仕事をしている人なら、このような事態に何度か直面したことがあるでしょう。もちろん、「テキストデータで送って！」と言えれば、何の問題もありません。しかし相手が上司やお客さんだとなかなか言えませんし、勇気を出して伝えても、「テキストデータ？きょーゆーふぉるだ？よくわかんないけど、データは送ったよ☆」となることが多く、この悩みは尽きそうにありません。そんなときは、画像データをテキストデータに変換できる「OCR」がおすすめです！OCRソフトには色々あり、一昔前は有償のものが
「画面上の英文を読み取ってそのまま翻訳できます」―ゲーム向け汎用翻訳支援ツールPCOT作者ぬるっぽ氏インタビュー【有志日本語化の現場から】 | Game*Spark - 国内・海外ゲーム情報サイト
- 86 users
- www.gamespark.jp
- アニメとゲーム
- 2021/07/02
海外のPCゲームをプレイする際にお世話になる方も多い有志日本語化。今回は視点を変え、人間による翻訳ではなく機械翻訳の利便性を高めるアプローチに迫ります。日本語化とは海外のゲームを日本語で遊べるようにすることです。その中でも、デベロッパーやパブリッシャーによる公式の日本語化ではない、ユーザーによる非公式な日本語化を有志日本語化（有志翻訳）と呼びます。一般的にボランティアで行われ、成果物は無償で配布されます。連載第15回は、ゲーム画面の英語を読み取り自動的に翻訳するフリーソフト「PCOT」の作者ぬるっぽ氏に話を訊きました。ヌルポインターストライク（翻訳支援ツールPCOTの配布サイト） PCOTの機能紹介その1（基本機能） PCOTの使い方は簡単。翻訳したいゲームを選択し、好きなタイミングで位置を指定するだけです。すると自動的に英文が読み取られ、日本語に翻訳されて表示されます。とある
- 翻訳
- ゲーム
- translation
- あとで読む
- game
- 文章
- english
古文書を解読できるiOSアプリ、凸版印刷が無料配信　手書きや木版のくずし字に対応　解読率は90％
- 85 users
- www.itmedia.co.jp
- テクノロジー
- 2023/06/01
凸版印刷（東京都文京区）は6月1日、くずし字解読アプリ「古文書カメラ」（iOS）の配信を始めた。AI-OCR技術を活用したアプリで、スマートフォンで撮影したくずし字をその場で解析できる。アプリのインストールは無料、解読機能は、1日に10回まで利用可能。書簡などの手書きと木版印刷で作られた版本、それぞれのくずし字に対応したAI-OCRエンジンを搭載しており、解読率は90％に及ぶという。AIが全ての文字を自動で検出し、解読する「フルオートモード」と、文字候補を提案することでさらに詳細な解読を可能にする「範囲選択モード」を備える。もしAIの解読結果が間違っていた場合、ユーザーが修正できる。修正内容はAIが再学習し、解読精度を向上させられるという。解読結果は画像とテキストデータで保存可能。同社ではこれまでも古文書解読事業を進めており、今回のアプリもその一環。古文書のほとんどはくずし字で書かれ
- iOS
- アプリ
- カメラ
- あとで読む
- AI
- 技術
紙の書類を高精度にテキストデータ化できる無料Webサービス『Free Online OCR』【今日のライフハックツール】 | ライフハッカー・ジャパン
- 85 users
- www.lifehacker.jp
- テクノロジー
- 2021/07/06
三井住友カードゴールド(NL)のデメリットは?メリットない・いらないは勘違い【年会費無料になる100万円修行のコツ】
- webサービス
- あとで読む
- OCR
- pdf
- 謎
- free
- データ
深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
- 84 users
- speakerdeck.com/sansandsoc
- テクノロジー
- 2021/12/03
■イベント  ：【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要タイトル：深層学習時代の文字認識とその周辺発表者：  技術本部 DSOC R&D研究員　宮本優一 ▼Twitter https://twitter.com/SansanRandD
- ocr
- 機械学習
- あとで読む
- machinelearning
- 画像処理
- slide
- 画像
簡単に利用できる PDF 文字認識 OCR 比較まとめ～ AI OCR の頭抜けた実力 - GMOインターネットグループグループ研究開発本部
- 83 users
- recruit.gmo.jp
- テクノロジー
- 2021/07/11
D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。・AI OCR は Google vs Microsoft の構図。両者精度高。・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect
- ocr
- あとで読む
- AI
- ツール
- Webサービス
古文書などの「くずし字」解読が簡単にできる一般向けAI-OCRアプリ、凸版印刷が開発。2023年提供予定
- 82 users
- internet.watch.impress.co.jp
- テクノロジー
- 2022/09/26
- AI
- OCR
- アプリ
- 歴史
- あとで読む
- 知識
- これはすごい
[スタパ齋藤のApple野郎] iPhoneがOCRスキャナーになる！　2月に爆誕した神アプリで紙の文字をテキスト化!!!
- 82 users
- k-tai.watch.impress.co.jp
- テクノロジー
- 2020/03/11
- OCR
- あとで読む
- iPhone
- appli
- アプリ
- Mac
- Photo
- pc
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
- 81 users
- ai-data-base.com
- テクノロジー
- 2023/09/06
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat（Neural Optical Understanding for Academic Documents）』という新しいOCR（光学式文字認識）技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。参照論文情報タイトル：Nougat: Neural Optical Understanding for Academic Documents 著者：Lukas Blecher, Guillem
- OCR
- AI
- あとで読む
- pdf
情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ
- 78 users
- levtech.jp
- テクノロジー
- 2023/12/20
情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ 2023年12月20日株式会社LayerX 機械学習・データ部機械学習グループマネージャー松村優也 1993年生まれ。2018年3月、京都大学大学院情報学研究科社会情報学専攻修士課程修了。在学中の起業経験を経て、新卒でウォンテッドリー株式会社に入社、推薦システムチームの立ち上げに関わる。2021年にはWantedly VisitのPdM、開発組織のEMを兼任。2022年9月に株式会社LayerXに機械学習エンジニアとして入社。2023年には機械学習チームのリーダー、現職に就任。 X（Twitter） Speakerdeck 技術や業界など仕事についての情報収集の基盤として多くのエンジニアを支えていたTwitter（現X）が、以前とは異なる姿となってゆく今、必要な情報を過不足なく
- 学習
- あとで読む
- 勉強
- 技術
- 書籍
- work
- 情報
凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発
- 77 users
- www.holdings.toppan.com
- テクノロジー
- 2022/11/12
2022/11/11 凸版印刷、明治期から昭和初期の手書き文字を解読する AI-OCRを日本で初めて開発
- 技術
- OCR
- あとで読む
- 文字
- 日本語
- 人工知能
- AI
PDFから「使える」テキストを取り出す（第1回） - golden-luckyの日記
- 75 users
- golden-lucky.hatenablog.com
- 暮らし
- 2019/12/01
PDFからテキストを取り出すのは、意外と大変です。それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵（「グリフ」）をコンピューターで扱えるような「文字」にする方法です。これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出すこのうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ（文字の形）をページ上に表示するための汎用の仕組
- pdf
- text processing
- adobe
- format
- ノート
- gtd
- deferred
- stationery
- history
Windows 10上で無料利用できるAI-OCR 認識精度は95％認識枚数は制限なし | Ledge.ai
- 74 users
- ledge.ai
- テクノロジー
- 2021/07/16
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- OCR
- あとで読む
- AI
- 未分類
- windows
- *あとで読む
なぜDXは分かりにくいのか？なぜ３種類のDXが生まれたのか？ビジネスパーソンのためのDX入門セミナー【セミナーレポート】 | Aidemy Business
- 72 users
- business.aidemy.net
- テクノロジー
- 2021/02/19
Aidemy Business > AI-CAN > なぜDXは分かりにくいのか？なぜ３種類のDXが生まれたのか？ビジネスパーソンのためのDX入門セミナー【セミナーレポート】この記事は2020年12月23日に開催されたWebセミナー「DXを徹底解説！ビジネスパーソンのためのDX入門セミナー」のレポートです。 ※記事化のために一部を編集しています。 2020年12月23日、“中山ところてん”として知られる株式会社NextInt代表の中山心太氏と、株式会社アイデミーの共催セミナーが開催されました。Aidemy Businessの新講座「ビジネスパーソンのためのDX入門講座」を制作された中山氏が、そのエッセンスを凝縮してお話しくださいました。進行は、アイデミーで開発本部コンテンツ部長を務める登坂直矢です。中山ところてん（中山心太）氏株式会社NextInt代表著書：『仕事ではじめる機
- DX
- あとで読む
- 組織
- 会社
- AI
- technology
- 技術
- 開発
分厚いハードカバーばかり持っている人間が家の本の電子書籍化に手を出した経過報告 - 基本読書
- 71 users
- huyukiitoichi.hatenadiary.jp
- 学び
- 2021/01/21
最近家の本の電子書籍化に着手している。もともと僕は本は大量に買うが、それをいつまでもとっておくのではなく、定期的に売るか捨てるかしていた。理由は単純で、家が狭く、引っ越しが多いからだ。転職も多く、乗り物酔いがひどく、電車に乗っただけで吐きそうになるので、毎回会社の徒歩圏内に引っ越す必要があるのである。一人暮らしなので当然ワンルームだ。そうすると、本を何千冊も置いておくスペースは存在しないし、持ち運ぶのも非効率だ。なので、泣く泣く本たちを処分する。過去の本を参照する必要がある時も多いが’、そういう時は諦めて2000円の本だろうが、古書で5000円になっていようが、諦めて買い直していた。その再購入費用はだいたい年間5万〜10万程度で、場所代・保管費よりは安い、という塩梅であった。ところが、先日SF年間ベスト記事で告知を出したが、いまSFについての本を書いていて、大量の本を買い直したり資料を
- 電子書籍
- 本
- 電子書籍化
- 書籍
- book
- 生活
- books
- 読書
- あとで読む
- 技術
手書き文字を認識できるAIを無償公開自社サービスでAI OCRが利用可能に | Ledge.ai
- 71 users
- ledge.ai
- テクノロジー
- 2021/07/01
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.
- 71 users
- github.com/JaidedAI
- テクノロジー
- 2020/07/03
4 September 2023 - Version 1.7.1 Fix several compatibilities 25 May 2023 - Version 1.7.0 Add Apple Silicon support (thanks@rayeesoft and @ArtemBernatskyy, see PR) Fix several compatibilities 15 September 2022 - Version 1.6.2 Add CPU support for DBnet DBnet will only be compiled when users initialize DBnet detector. 1 September 2022 - Version 1.6.1 Fix DBnet path bug for Windows Add new built-in mo
日本語特化のAI文字起こしサービス　1時間の音声を5分で文字化、句読点も自動で調整
- 71 users
- www.itmedia.co.jp
- テクノロジー
- 2020/09/01
日本語に特化した自然言語処理技術を用いることで、句読点の位置を自動で調整し、自然な日本語のテキストを出力できるという。会議の議事録や会話の記録、取材内容の文字起こしなどの活用を想定する。今後は録画した映像データを文字起こしする機能や、文字起こし結果を表示する画面でテキストを編集できる機能を採用するとしている。関連記事 Microsoft、「Word for Web」にトランスクリプト（文字起こし）機能を追加 Web版のMicrosoft Wordに、音声をテキストに変換する機能「トランスクリプト」が追加された。まだ対応するのは英語のみだが、対応言語を拡大していく計画。複数の話者を区別してテキスト化し、テキストはそのままWordのドキュメントに挿入できる。 DropboxとZoomが連携強化　ビデオ会議の録音・録画・文字起こしをDropbox上に保存可能に DropboxとZoomの連携
- AI
- サービス
- 日本語
- あとで読む
- Tech
- web
- itmedia
- データ
- ダジャレ
「LLM」を活用したプロダクト開発に必要な能力とは何か　“機械学習の民主化”でますます注目される「MLPdM」の重要性
- 69 users
- logmi.jp
- テクノロジー
- 2023/06/21
大規模言語モデル（LLM）を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント第二弾。今回のテーマは「大規模言語モデルがつくる新しい顧客体験」。ここで登壇したのは、株式会社LayerXの松村優也氏。機械学習の民主化とMLPdMの重要性について発表しました。 LayerX社・機械学習チームのマネージャーの松村優也氏松村優也氏：それでは、LayerXの松村優也が「機械学習エンジニアから見るプロダクト開発におけるLLM」を副題として、「機械学習の民主化とMLPdMの重要性」というタイトルで10分お話しします。お願いします。簡単な自己紹介ですが、あらためて、松村です。（スライドの）右上の黒いアイコンでよくSNSをやっています。「Twitter」などのIDはご覧のとおりです。バックグラウンド的には、もともと京都大学で情報検
- LLM
- 機械学習
- あとで読む
- ChatGPT
- AI
【2024年】AWS全サービスまとめ | DevelopersIO
- 69 users
- dev.classmethod.jp
- テクノロジー
- 2024/01/12
こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの？」という疑問を自分なりに理解するためにまとめました。今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個です。まとめるにあ
- AWS
- あとで読む
- まとめ
- techfeed
- サービス
- システム
- 技術
Zero-shot Learning網羅的サーベイ：CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
- 67 users
- techblog.exawizards.com
- テクノロジー
- 2023/05/10
こんにちは！　画像システムグループで機械学習エンジニアをやっている小島です。この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。注意事項この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。また、文章中の画像は、特別な記載がない限り、引用元の論
- 機械学習
- cv
- あとで読む
- nlp
Google Drive、OneDrive、Box、Dropbox――進化を続ける4大クラウドストレージの機能を徹底解説
- 67 users
- www.itmedia.co.jp
- テクノロジー
- 2020/02/19
Google Drive、OneDrive、Box、Dropbox――進化を続ける4大クラウドストレージの機能を徹底解説（1/2 ページ） Google DriveやMicrosoft OneDrive、さらにはDropboxやBoxなどのクラウドストレージは、今やかなりなじみのあるクラウドサービスだ。ストレージ領域がクラウド上にあれば、PCやスマートフォンなど多様なデバイスからデータを保管でき、場所を選ばずアクセスできる。クラウドストレージは当初、単価当たりのストレージ容量の大きさやデータ同期スピードの速さが優位性だった。その後はデータ共有機能や他のアプリケーションとの連携、コンプライアンス対応機能などが追加され、進化を続けている。では、これら代表的なクラウドストレージの特徴を探っていこう。 MicrosoftやGoogleはコンプライアンスを確保できる企業向け機能を強化 OneDri
- Dropbox
- あとで読む
- ストレージ
- クラウド
- Google
- net
- Microsoft
- pc
PDF を Gyazo に展開して Scrapbox の記事にして全文検索する - Diary
- 66 users
- diary.ssig33.com
- テクノロジー
- 2020/03/18
PDF を Gyazo に展開して Scrapbox の記事にして全文検索するという試みについてです。まず PDF を Gyazo に展開して Scrapbox の記事にするということですが、これについてブラウザ上で簡単に動くツールを実装しました。 https://ssig33.github.io/pdftoscrapbox/ おそろしく素朴な見た目ですがとりあえず動きます。Chrome や Edge に Tamper Monkey (試してないけど Firefox と Greasemonkey でも動くんじゃないかな)を入れて、 input に Scrapbox のプロジェクト名を入れて user.js をインストールした上で赤いところに PDFをドラッグ&ドロップすると、 PDF.js で PDF でレンダリングした上で全てのページを Gyazo にアップロードして Scrapbo
- Scrapbox
- PDF
- OCR
- あとで読む
- search
- 検索
- library
- ツール
〜OCR戦記〜適格事業者登録番号との戦い🔥🔥🔥 - LayerX エンジニアブログ
- 66 users
- tech.layerx.co.jp
- テクノロジー
- 2023/11/08
この記事はLayerXテックアドカレ2023の5日目の記事です。昨日はmakogaさんがEngineering Career Ladderを作るときに気をつけたこと　其の一を書いてくれました。次回はyuya-takeyamaさんがMicrosoft Graph APIについて書いてくれます！乞うご期待！こんにちは、機械学習を通じて誰かをラクにしたい yakipuです。今回は、10月から始まったインボイス制度に伴う適格請求書発行事業者登録番号（以下「登録番号」と表記します）のOCR読み取りの戦いについて記したいと思います。インボイス制度は、売手が買手に対して正確な税率や消費税額を示す適格請求書（インボイス）を交付することで、買手が仕入税額控除の適用を受けるために必要な制度です。売手側は登録事業者として登録番号などが記載されたインボイスを交付し、買手側はインボイスを保存する必要があり
- OCR
- あとで読む
- 技術
- clip
OCR機能や記号入力補助ツールを強化した「PowerToys 0.66.0」がリリース／自己完結型「.NET 7」アプリとなりランタイム管理も簡素化、リソース消費も削減
- 65 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/01/06
- Windows
- PowerToys
- ツール
- tool
- あとで読む
- 未分類
- net
- app
画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
- 65 users
- gigazine.net
- テクノロジー
- 2021/09/19
画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle （practical ultra lightweight OCR system, support 80+ languages recog
国会図書館デジコレから全文テキストをダウンロードするだけのブックマークレット - ronbun yomu
- 65 users
- hjl.hatenablog.com
- 学び
- 2022/11/14
リニューアルに際して、ブックマークレットの箇所も更新しました。（2022/12/21）使えなくなってたのでまた更新しました。（2023/01/05）これは何の記事国会図書館次世代デジタルライブラリーで古典籍が検索できるようになって、いよいよすごいことになっている。／古典籍資料の全文検索が可能になります！＼ 11月1日（火）に、実験システム #次世代デジタルライブラリーに古典籍資料6万点のOCR全文テキストデータを追加します。これまでの明治以降の図書に加え、江戸期以前のくずし字等資料の全文検索も可能となります。https://t.co/9KT1CdaSYa pic.twitter.com/aOz7OmyWew— 国立国会図書館　NDL (@NDLJP) 2022年10月26日まじでいいんですか？次世代デジタルライブラリー上でテキストのダウンロードもできる（右下の「この資料の