OCRの人気記事 10件 - はてなブックマーク

1 - 10 件 / 10件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

OCRの検索結果1 - 10 件 / 10件

さようなら、全てのエヴァーノート - 本しゃぶり
- 1779 users
- honeshabri.hatenablog.com
- テクノロジー
- 2024/04/14
2011年6月10日、Evernoteを使用開始。 2014年9月19日、有料プランに加入。 2024年3月23日、クソみたいなメールが届く。プラン、廃止いつも Evernote をご利用いただき、ありがとうございます。このたびは今後の Evernote 登録プランに関する変更についてご案内させていただきます。お使いの Evernote アカウントは Plus から Personal に移行されました。Evernote Plus など、一般のお客様に数年間ご利用いただけなかった従来の登録プランが廃止となったためです。この変更により、Personal プランで利用可能な機能すべてをご利用いただけます。今後はAnnualの登録プランが現在の Evernote Personal プランの料金 129.99 USD/Yearに合うように更新されます。この料金は次の更新日である2024/4/
- evernote
- obsidian
- webサービス
- あとで読む
- Notion
- ツール
- サービス
- AI
- メモ
- 生活
GPTが人知れず既存の名刺管理アプリを抹殺していた話 - Qiita
- 504 users
- qiita.com/watanabe-tsubasa
- テクノロジー
- 2024/02/27
抹殺は言い過ぎかもしれませんが簡易な名刺管理アプリであれば自作で十分という時代がきていたようですこれで紙の名刺からはきっとバイバイできるでしょう！名刺管理アプリ作ってほしいといわれたそれは2/22のお話。ことの発端は別の部署からかかってきた一本の電話でした。新規事業の部署でいろいろな取引先様と付き合いがあるものの、紙の名刺が非常に多く管理に困っているとのことのことです。私は小売業に勤務しているしがない一社員で、現在Eコマースの戦略立案に関する部署に所属しています。電話先の方は、以前一緒の部署で勤務したことがある方です。現在新規事業のプロジェクト推進をしており、冒頭のような課題感を持っているため既存の名刺管理アプリ導入を考えたのですが、あまりのお値段の高さに卒倒して私に藁をもすがる思いで連絡されたようです。これまでのアプリは名刺の識別専門のAI（）を使っていた話を聞いてみた
- ChatGPT
- あとで読む
- AI
- OCR
- python
- api
- アプリ
- GPT
- LINE
- プログラミング
pdfからtextを抜き出す試行錯誤のメモ｜Kan Hatakeyama
- 465 users
- note.com/kan_hatakeyama
- テクノロジー
- 2024/02/23
これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。参考記事導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。解析コード： from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード： for structure in pdf_elements: print(structure) 結果：残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ
- PDF
- あとで読む
- python
- AI
- LLM
- テキスト
- ツール
- ドキュメント
- 自然言語処理
- メモ
PCの操作をすべて録画＆文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」
- 337 users
- gigazine.net
- テクノロジー
- 2024/05/06
PCを使っていると、過去の操作内容やブラウザで閲覧していた情報を思い出したくなるタイミングが頻繁に発生します。そんな時に役立ちそうなPC操作記録アプリ「Windrecorder」がオープンソースで開発されています。 GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. https://github.com/yuka-friends/Windrecorder I made an o
- PC
- あとで読む
- アプリ
- windows
- データベース
- セキュリティ
- tool
- 検索
- GitHub
- データ
macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online
- 294 users
- doratex.hatenablog.jp
- テクノロジー
- 2023/06/29
macOS 12 Monterey では，OSビルトインでのOCR機能が搭載されました。Preview.app で，画像やスキャンPDF（中身がスキャン画像のPDF）に対して，ただマウスでドラッグするだけで，中身の文字を認識して選択し，コピーできるようになっています。さらに，macOS 13 Ventura では，それが日本語にも対応しました。たとえば，（今や入手困難となってしまった）The TeXbook のアスキーによる日本語版をスキャンしたものを Preview.app で開くと，何もしなくても，文字選択できます。これをコピーして他のエディタにペーストすると， TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた
- ocr
- mac
- あとで読む
- macOS
- pdf
- コマンド
- app
- command
- コード
- shell
RAGの性能を改善するための8つの戦略 | Fintan
- 263 users
- fintan.jp
- テクノロジー
- 2024/02/09
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
- RAG
- LLM
- AI
- あとで読む
- 検索
- ChatGPT
- OCR
- チューニング
- 自然言語処理
- 人工知能
GPT-4oを使って2Dの図面から3DのCADモデルを作る
- 178 users
- zenn.dev/firstautomation
- テクノロジー
- 2024/05/19
はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上しているようです。製造業という観点からすると、これは設計図面などに活かせるようになるのでは？と思いました。機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。このような図と文字の複合データにおいて、GPT-4oの進化は有効なのではないかと考えました。 ※画像元URL: http://cad.wp.xdoma
- ChatGPT
- あとで読む
- CAD
- 3d
- AI
- GPT
- 機械学習
- 設計
- 画像
ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp
- 145 users
- gihyo.jp
- テクノロジー
- 2023/07/18
いまからわかる！ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って⁠⁠、請求書の構造化データを抽出する先月、OpenAIからFunction calling（関数呼び出し）機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAIが2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。外部ツールを呼び出して質問に答えるチャットボットを作成する自然言語を内部APIの呼び出しやSQLに変換するテキストから構造化データを抽出するたとえば天気予報と血液型
- ChatGPT
- あとで読む
- 人工知能
- APIエコノミー
- 文章生成AI
- api
- 機械学習
- techfeed
- GPT
- OCR
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 142 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- GPT
- OCR
- 人工知能
- api
Macで毎分スクリーンショットを撮って手元に貯めておくスクリプト - hitode909の日記
- 123 users
- blog.sushi.money
- テクノロジー
- 2023/12/03
書いてたテキストエリアがどっかいく、みたいなことがたびたびあって、スクショを定期的に取っていればこんなことにならないのに…と思っていた。先日、Redash用に、がんばって書いたSQLがどっかいってしまい、ものすごく悲しい、という出来事があったのであ、あまりに悲しさに、重い腰を上げてスクリプトを書いた。きのうがんばって書いたRedashクエリを保存せずに消してしまった悲しみから、Macの画面のスクリーンショットを撮り続けるスクリプトを書いて、xbar経由で毎分実行してキャプチャし続けている。Macに入ってるOCR機能も呼び出して検索できるようにしたい https://t.co/ibVVCLZszg— 趣味はマリンスポーツです (@hitode909) 2023年11月30日やっていること画面全体のスクショを撮って、デスクトップ内のフォルダに置いていく複数ディスプレイを使ってる場合も
- mac
- あとで読む
- ocr
- !!
- article
- github
- Ruby
- 画像