自然言語処理の人気記事 86件 - はてなブックマーク

1 - 40 件 / 86件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

自然言語処理の検索結果1 - 40 件 / 86件

表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz
- 972 users
- inzkyk.xyz
- テクノロジー
- 2024/04/27
その他のサンプル: Wikipedia:良質な記事, Wikipedia:長いページ紹介「テキストゆれないくん」は文章に含まれる表記揺れを検出するツールです。「コンピュータ」と「コンピューター」、あるいは「全て」と「すべて」といった同じ単語の別表記が使われていないかどうかをチェックできます。「テキストゆれないくん」は元々このサイト (https://inzkyk.xyz/) の文章校正用に開発されました。機能が成熟してきたので UI を付けて公開します。このページから手動で使う限り、「テキストゆれないくん」は商用/非商用を問わず自由に使って構いません。「テキストゆれないくん」は無保証で提供されます。特徴ウェブブラウザから使えるこのページをウェブブラウザで開いているなら、「テキストゆれないくん」は既に動いています。このページの最初にあるのは「テキストゆれないくん」を使うための完
- ツール
- あとで読む
- 文章
- webサービス
- 言語
- tool
- 小説
- パターン
- 便利
- 自然言語処理
【業務効率革命】GAS Interpreter の衝撃｜ChatGPT研究所
- 408 users
- chatgpt-lab.com
- テクノロジー
- 2024/04/12
今までで最もインパクトのあるGPTsが完成しました。その名も、「GAS Interpreter」です。このGPTは名前の通り、Code Interpreter のように Google Apps Script コードを生成し、その実行までを行います。他者に使ってもらうものではなく、自分専用のプライベートGPTです。人によっては、Code Interpreter よりも便利です。なぜかというと、インターネットアクセスができることに加えて、GAS の便利で豊富なライブラリやリソースが活用できるためです。例を示します。 GAS Interpreter の可能性以下に示す、いくつかの業務フローの実例をGAS Interpreterで行い、業務活用への可能性を示します。今日の予定を聞きます今日の予定を教えて下さい正確に今日の予定を教えてくれました。会議参加者の相手に連絡したいので、その
- ChatGPT
- AI
- あとで読む
- GAS
- google
- LLM
- GPT
- スライド
- セキュリティ
- GPTs
SQL滅ぶべし | ドクセル
- 323 users
- www.docswell.com
- テクノロジー
- 2024/05/06
SQL • リレーショナルデータベースシステムと会話するための言語 • 1970年 Codd が RDB モデルと同時に提案 (Alpha言語) • 1974年 Chamberlin と Boyce が改良 • 元々は SEQUEL (Structured English Query Language) だったが、商標登録されていた • 読み方はエスキューエルとそのまま読む (Glliespie 2012)
- SQL
- あとで読む
- データベース
- RDB
- DB
- プログラミング
- RDBMS
- language
- database
いちばんやさしいローカル LLM｜ぬこぬこ
- 281 users
- note.com/schroneko
- テクノロジー
- 2024/04/21
概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、
- LLM
- あとで読む
- AI
- ChatGPT
- Mac
- 人工知能
- 自然言語処理
- モデル
- 機械学習
【未経験者大歓迎】RAG超入門：AWSが推奨するRAGを体験するハンズオン - Qiita
- 243 users
- qiita.com/moritalous
- テクノロジー
- 2024/05/03
2024/5/5更新：生成AIに興味を持った方向け、続編を投稿しました。「Qiitaに聞いた！！」をAmazon Bedrockで作った！（Claude 3でRAG）タイトルはふざけてますが、プロンプトエンジニアリングにより本投稿と同様の内容を行う解説をしています。（BedrockのClaude 3モデルと、Google検索を使った構成です）生成AIはとても注目度が高い技術ですが、すこしとっつきにくいところがあるかもしれません。新しいモデルや活用手法が毎日のように登場し、ウォッチし続けるのはかなり大変です。タイミングを逃して入門できていない方向けに、とりあえず作って体感してみようというコンセプトで、ハンズオン記事を作成しました。🎉🎉🎉 ハンズオンの内容は「RAG」です。RAGは生成AIの活用法としてよく出てくるキーワードです。ハンズオンでは、ただのRAGではなく最先端の
- aws
- あとで読む
- RAG
- AI
- LLM
- qiita
- 自然言語処理
- 入門
- ブログ
- 参考
LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由｜erukiti
- 221 users
- note.com/erukiti
- テクノロジー
- 2024/04/24
もしあなたがLLMを使ったプロダクトを何かしら開発している、もしくは興味があるのなら、メモリを大量に積んだMac Studioの購入を検討すべきです。対象読者NVIDIAが絶対にいいという人はこの記事の対象読者ではありません。また、用途によって、ローカルマシンによるローカルLLMが向いてる・向いてないは明確にあるので、向いてない用途にしか使わない人も対象読者ではありません。あしからず。また、この記事は別にNVIDIAをdisる意図はありません。みんな違っていい。NVIDIAもいい選択肢ですが、Mac Studioも悪くないですよ、と言いたい。結論LLMプロダクト開発において、今年はもはやローカルLLMを無視できない、してはいけない状況です。 LLMプロダクト開発をする会社の視点でいえば、是非とも80GB以上の十分なGPUメモリを積んだマシンを用意できるようなアジリティを持つのが望まし
- LLM
- AI
- mac
- あとで読む
- 人工知能
- GPU
- 開発
- プロダクトマネジメン
- 絶対
- techfeed
Python 3.12で増えた並列処理と、これまでの並列処理の挙動を比べてみる - Qiita
- 212 users
- qiita.com/ShotaOki
- テクノロジー
- 2024/04/30
この記事ですることを3行で Pythonの標準ライブラリでできる並列実行を、あらためて総当たりで速度比較しようウォーターフォールチャートで、それぞれの並列処理の処理時間の特徴を可視化しよう boto3の実行をモデルケースにして、どの並列処理が一番早いのかを調べようこの記事の結論を先に Python 3.12から本格的に使えるようになったサブインタープリターは、CPUで実行する処理について言えば、従来のサブプロセスよりも高速 boto3の実行は、サブインタープリターよりも署名付きURLの非同期実行のほうが速い → S3からの10ファイルの取得であれば、実行時間を90%削減できます → Bedrockの3回実行であれば、実行時間を60%削減できます今回使ったソースコードはこちらに置いています。お手持ちの環境で再実行できるようにしていますので、気になる方はぜひ。どうしてこの記事を書くの
生成AIによるプロダクトと生産性向上の舞台裏@2024.04.16
- 186 users
- speakerdeck.com/mazeltov7
- テクノロジー
- 2024/04/17
2024.04.16「先達エンジニアに学ぶ思考の現在地 Online Conference」での登壇スライドです event link: https://findy.connpass.com/event/313119/ 生成AIを使ってプロダクト作りをしていたり、社内の生産性向上をチャレンジしてる方に少しでも参考になれば幸いです。
- AI
- あとで読む
- LLM
- エンジニア
- 人工知能
- programming
- スライド
- プロダクト
- 仕事
- dev
GPT-4に日本語特化モデル　OpenAI Japan始動会見で発表
- 185 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/15
米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表 OpenAIは、11月に発表した「GPT-4 Turbo」のプレビュー版をリリースすると発表した。「GPT-4」が怠け者になってきたという苦情を受け、怠けにくくしたという。公式版は数カ月中にリリースする計画だ。マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenA
- AI
- あとで読む
- ChatGPT
- GPT
- OpenAI
- 人工知能
- 日本語
- 技術
- 言語
- techfeed
Introducing OpenAI Japan
- 143 users
- openai.com
- テクノロジー
- 2024/04/15
As we grow our operations internationally, we’re expanding into Asia with a new office in Tokyo, Japan. We are committed to collaborating with the Japanese government, local businesses, and research institutions to develop safe AI tools that serve Japan’s unique needs and to unlock new opportunities. We chose Tokyo as our first Asian office for its global leadership in technology, culture of servi
- OpenAI
- AI
- あとで読む
- ChatGPT
- LLM
- deeplearning
- 自然言語処理
- 人工知能
- japan
RAGを複雑な質問に強くする手法「CoA」について
- 142 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/04/16
本記事では、「Chain-of-Abstraction (CoA) Reasoning」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、最近聞くようになった「Chain-of-Abstraction (CoA) Reasoning」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー LLMが外部ツールを使って回答を生成するときの、回答精度を高める手法についての論文です。Metaの研究者らによって2024年1月に提案されました。「Chain-of-Abstraction (CoA)」という手法を使うメリットは、RAGに応用することで
- RAG
- LLM
- AI
- あとで読む
- 自然言語処理
- 機械学習
- 読んだ
生成AIでGPUがいらなくなる？　業界を揺るがす「1ビットLLM」とは何か、識者に聞いた
- 132 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/16
ではそもそも“1bit”とは何が1bitなのか、どうして1bitになるとGPUが不要になるのか。LLMでGPUが不要になるとどんな世界が訪れるのか。オーダーメイドによるAIソリューション「カスタムAI」の開発・提供を行うLaboro.AIの椎橋徹夫CEOに聞いた。プロフィール：椎橋徹夫米国州立テキサス大学理学部卒業後、ボストンコンサルティンググループに参画。消費財や流通など多数のプロジェクトに参画した後、社内のデジタル部門の立ち上げに従事。その後、東大発AI系のスタートアップ企業に創業4人目のメンバーとして参画。AI事業部の立ち上げをリード。東京大学工学系研究科松尾豊研究室にて「産学連携の取り組み」「データサイエンス領域の教育」「企業連携の仕組みづくり」に従事。同時に東大発AIスタートアップの創業に参画。2016年にLaboro.AIを創業し、代表取締役CEOに就任。 ──まず、1bi
- AI
- LLM
- あとで読む
- 人工知能
- techfeed
- GPT
- 自然言語処理
- CPU
OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics
- 114 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/04/17
はじめにこんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri
- api
- ChatGPT
- あとで読む
- AI
- LLM
- 生成AI
- GPT
自宅PCでクラスターを構築：コンシューマーGPUの枠を超え、大型LLMをローカルで動かす！｜AIサトシ
- 113 users
- note.com/aisatoshi
- テクノロジー
- 2024/04/22
最近オープンになる大規模言語モデル（LLM）が、軒並みGPT-4レベルの性能となっています Huggngfaceで無料でダウンロードできるのですが、問題は必要VRAM容量です話題の、Command-r-Plusは、日本語性能について評価が高く、一部の性能はGPT-4並みと言われますが、さすがに大型で104Bパラメータもあるため、4bitに量子化しても60GB程度のVRAMが必要となります。コンシューマークラスのGPUの最高峰、RTX4090は、VRAM24GBのため、command-r-plusをすべてGPUに載せて推論しようと考えると、3台のマルチGPUデスクトップが必要ですしかし、RTX4090は450W消費のGPUのため冷却機構が大きく、1デスクトップに3台収めるのは至難の業となります。先日、水冷ラジエーター付きRTX4090で、マルチGPUデスクトップを作成しました。水冷
- LLM
- あとで読む
- AI
- GPU
- PC
- 人工知能
Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
- 87 users
- blog.shikoan.com
- テクノロジー
- 2024/04/27
2.3k{icon} {views} 複数のLLM（GPT/Claude3）とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題（TSP）が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。できたもの Arxivの検索APIを使って検索拡張生成（RAG）したらサーベイを自動生成できたやっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題（TSP）を解いてソートをかける論文の要旨をGPT-3.5-Turboで要約ソートした
- RAG
- AI
- あとで読む
- 自然言語処理
- アルゴリズム
- LLM
- 論文
- 研究
1BitLLMの実力を見る｜shi3z
- 77 users
- note.com/shi3zblog
- テクノロジー
- 2024/04/18
1BitLLMは本当に実現可能なのか?そして、実現されると予告されていることに意味はあるのか? ようやく再現実装に成功した人が現れたので僕も試してみた。ちなみに1Bit(1.58bit) LLMについての考察はこのページが面白いので一読をお勧めする。ただし、普通のHuggingFaceのお作法とはかなり違うので注意が必要。まず、このHuggingFaceリポジトリを丸ごとgit cloneする $ git lfs install $ git clone https://huggingface.co/1bitLLM/bitnet_b1_58-3B $ cd bitnet_b1_58-3Bこれをやらずにいつもの凡例みたいにいきなりpipelineに読み込もうとすると謎のエラーが出て悩まされることになる。海外でも悩んでる人が何人もいるみたいだ。まあ個人的には「こんな説明で誰がわかる?」と思
- LLM
- あとで読む
- AI
- 機械学習
噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想｜shi3z
- 70 users
- note.com/shi3zblog
- テクノロジー
- 2024/05/08
最近にわかに話題のLLMツール「Dify」を僕も使ってみた。いいところと「?」となったところがあったので纏めておく Difyとは、GUIでワークフローを組むことができるLLM-OPSツールだ。 ComfyUIのようにワークフローが組めたり、GPTsのように自分専用のアシスタントを作れたりできる。特に、OpenAIのGPTシリーズとAnthropicのClaude-3、そしてCohereのCommand-R+なんかを組み合わせて色々できるところは良いところだと思う。また、ローカルLLMにも対応しているので、企業内でのチャットボットを作るんだったらGPTsよりこっちの方がいいだろう。元々色々なテンプレートが用意されているが、テンプレだけ使うとGPTsっぽいものを作れる(それだってすごいことだが)。テンプレを改造するだけでも欲しいものが作れる人はいるし、ここはノーコード環境と言えるテンプ
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
- 61 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/19
米Metaは4月18日（現地時間）、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で間もなく利用可能になる。昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル（こちらはまだ公開されていない）のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5％以上が非英語データで構成されて
Dify のワークフローの概要｜npaka
- 61 users
- note.com/npaka
- テクノロジー
- 2024/05/04
以下の記事が面白かったので、簡単にまとめました。・Workflow - Dify 1. ワークフロー1-1. ワークフロー「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。「ワークフロー」の種類は、次のとおりです。・Chatflow : 顧客サービス、セマンティック検索など、応答作成に複数ステップのロジックを必要とする会話シナリオ用・Workflow : 高品質な翻訳、データ分析、コンテンツ作成、電子メールの自動化など、自動化・バッチ処理シナリオ用 1-2. Chatflow自然言語入力におけるユーザー意図認識の複雑さに対処するため、「質問分類」「質問書き換え」「サブ質問分割」などの問題理解ノードを提供します。さらに、LLMに外部環境との対話機能、すなわち「
- LLM
- AI
- あとで読む
- 人工知能
- ツール
LLMプロダクト開発とはどういうものなのか？｜erukiti
- 59 users
- note.com/erukiti
- テクノロジー
- 2024/04/26
LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由という記事を書きました。 mutaguchiさんのツイートを見て、LLMプロダクトの開発とはどういうものなのかを知らない人も多いのかなと気づいたので、そこらへんを記事として書いてみます。 https://t.co/4WvjuuoGnC 「LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由」の記事のはてブコメント見てたんだけど、ほとんど理解されてなかったのが興味深い。・プロプライエタリなLLMでは、ランニングコストが嵩み、これを利用したサービスは成立しづらい… — mutaguchi (@mutaguchi) April 24, 2024 商用LLM APIとローカルLLMって使い方が全然違う気がしてる。商用LLM APIって、機微情報を送らないこと、規約違反テキストを送らないこ
- LLM
- AI
- あとで読む
- 開発
- プロダクト
- mac
- programming
- 学習
- プログラミング
Meta Llama 3
- 56 users
- llama.meta.com
- テクノロジー
- 2024/04/19
Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.
- meta
- llama
- AI
- LLM
- あとで読む
- 人工知能
- tech
- programming
Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
- 52 users
- gigazine.net
- テクノロジー
- 2024/04/10
Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。 [2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs https://arxiv.org/abs/2404.05719 Apple teaching an AI system to use apps; maybe for advanced Siri https://9to5mac.com/2024/04/09/ferret-ui-advanced-siri/ ChatGPTのようなチャットボットAIシステムのベースとなっている大規模言語モデル(LLM)は、主にウェブサイトから収
- Apple
- 人工知能
- LLM
- あとで読む
- AI
- UI
- iPhone
LLMエージェントのデザインパターン、Agentic Design Patternsを理解する
- 51 users
- zenn.dev/loglass
- テクノロジー
- 2024/04/15
「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント（以下、LLMエージェント）の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明します (Part5の前に公開してしまったので、後追いで更新予定です) Agentic Design Patterns Part 1 Agentic Design Patterns Part 2, Reflection Agentic Design Patterns Part 3, Tool Use Agentic Design Patterns Part 4, Planning Agentic Design Patterns Part 5, Multi-Agent Collaboration 動画もあります。 LLMエージェントについての説明
- LLM
- agent
- ai
- あとで読む
- 人工知能
- ツール
LLMを活用した大規模商品カテゴリ分類への取り組み | メルカリエンジニアリング
- 49 users
- engineering.mercari.com
- テクノロジー
- 2024/04/11
こんにちは、メルカリの生成AIチームで ML Engineer をしている ML_Bear です。以前の記事[1]では商品レコメンド改善のお話をさせていただきましたが、今回は、大規模言語モデル (LLM) やその周辺技術を活用して30億を超える商品のカテゴリ分類を行なった事例を紹介します。 ChatGPTの登場によりLLMブームに火がついたということもあり、LLMは会話を通じて利用するものだと認識されている方が多いと思いますが、LLMが有する高い思考能力はさまざまなタスクを解決するためのツールとしても非常に有用です。他方、その処理速度の遅さや費用は大規模なプロジェクトでの活用にあたっての障壁となり得ます。本記事では、こうしたLLMの課題を克服するためにさまざまな工夫を施し、LLM及びその周辺技術のポテンシャルを最大限に引き出して大規模商品データのカテゴリ分類問題を解決した取り組みについ
- llm
- あとで読む
- AI
- oss
- 機械学習
- API
ChatGPTの Assistants API でPDFを要約 - Taste of Tech Topics
- 47 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/04/16
こんにちは、安部です。最近急に、暖かさを通り越して暑いぐらいになってきましたが、皆さまいかがお過ごしでしょうか。季節外れかなとも思いつつ、もう半袖で過ごしたいくらいの気候ですね。さて、今回は、OpenAIのAssistants APIの使い方を紹介していきます。題材は「PDFを和訳して要約してもらう」としました。これはWeb版のChatGPTでも単にPDFファイルを添付して依頼すればできますが、APIの使い方を示すサンプルとしてはちょうどよいと思います。最新情報については以下の公式ドキュメントをご覧ください。 https://platform.openai.com/docs/assistants/overview https://platform.openai.com/docs/api-reference/assistants それでは早速、Assistants APIの使い方
- ChatGPT
- AI
- LLM
- api
- pdf
- 人工知能
- OpenAI
- あとで読む
ローカルLLMはこーやって使うの💢
- 46 users
- gist.github.com/kyo-takano
- テクノロジー
- 2024/05/04
making-the-most-of-local-llms.ipynb Sorry, something went wrong. Reload? Sorry, we cannot display this file. Sorry, this file is invalid so it cannot be displayed.
Apple、iPhoneでも稼働するオープンな言語モデル「OpenELM」を公開
- 45 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/25
米Appleの研究者らは4月24日（現地時間）、オープンソースの言語モデル「OpenELM」（ELMはEfficient Language Model、効率的な言語モデルの略）をHugging Faceで公開した。パラメータ数の異なる4つのモデルがある。小さいものから、2億7000万、4億5000万、11億、30億（パラメータとは、意思決定でモデルがトレーニングデータセットから理解する変数の数を示す）。 AppleがAIのモデルを公開することはこれまでほとんどなかったが、OpenELMの「広範なリリースは、オープンな研究コミュニティを支援し、発展させることが目的」という。 Appleは、OpenELMとともに、開発者がモデルをソフトウェアに組み込めるように設計された複数のツールもオープンソース化した。その中にはiPhoneやMac上でモデルを実行できるようにするライブラリも含まれる。「
- Apple
- AI
- iPhone
- language
- 人工知能
- 言語
- あとで読む
- *あとで読む
Sakana AI
- 45 users
- sakana.ai
- テクノロジー
- 2024/04/22
日本語プロンプト対応の高速画像生成モデルEvoSDXL-JPで生成した画像の例。プロンプトは「可愛いゾウの編みぐるみ」、「ラーメン、浮世絵、葛飾北斎」、「折り紙弁当」、「（下町ロケット、東京サラリーマン）、浮世絵」など概要 Sakana AIは先日、進化的アルゴリズムを用いた基盤モデル構築の手法「進化的モデルマージ」を提案しました。また、進化的モデルマージにより構築された日本語の大規模言語モデルEvoLLM-JPと画像言語モデルEvoVLM-JPを公開しました。これらのモデルは、言語生成を目的とした自己回帰型Transformerモデルでした。今回私たちは、進化的モデルマージの可能性をさらに示すために、画像生成タスクで広く用いられる拡散モデルへの適用を行いました。このリリースの要点は以下の通りです。画像生成で昨今用いられている拡散モデルに進化的モデルマージを適用しました。言語生成モデ
【随時更新】主要な大規模言語モデル比較表
- 43 users
- zenn.dev/ml_bear
- テクノロジー
- 2024/04/28
これはなに？ひょんなことからOpenAI・Anthropic・GoogleのLLMの一覧表を作りました手前味噌ながら便利だなと思ったのでZennにも載せておきます各社のモデルの主要諸元・費用に加えて、自分の印象を書いてあります。性能の目安としてChatbot Arenaのスコアを参考までに添付していますこれはあくまで参考用かつ英語での評価なので、スコアが一番高いものがいい、もしくは低いからダメというわけではありません。少なくともこの記事に掲載されているモデルは、スコアが低いものでも単純な翻訳などでは十分な性能を持っています。そして何より高性能モデルとは比較にならないほど高速です。用途や使用言語によって試してみて最適なものを選ぶのが良いでしょう OpenAI 歴史的経緯もあり、以下の表に掲載するもの以外にも大量のモデルがあります。一旦は最新のモデルを列挙します。モデル名 A
準備0でローカルLLMを動かす(LM Studio)
- 40 users
- zenn.dev/howtelevision
- テクノロジー
- 2024/04/24
はじめに Metaが新しく公開したLLMの性能が他の最新モデルに匹敵する性能となっており、ベンダーから提供されるAPIを使わずに、自分のPC上でLLMを動かしたい欲求が高まりました。ローカルでLLMを動かすメリットとして、以下が考えられます。従量課金制のAPIの費用を気にしなくて良い (※PCの電気代はかかるが) 個人情報を第三者に送信しないので、プライバシー面を考慮する必要がない LM Studio ローカルでLLMを動かす懸念として、環境構築など準備に時間がかかることが一つ挙げられます。そこで、便利なツールを探していたところ、LM Studioを発見しました。このツールは、GUI上でLLMの取得から起動までをボタンクリックで進めることができます。さらに、チャットのUIやローカルサーバの起動・Pythonコード例の提示までしてくれる便利ツールとなっていました。操作手順使用し
- LLM
- API
- AI
- ツール
- あとで読む
- 便利
- PC
Dify で RAG を試す｜npaka
- 40 users
- note.com/npaka
- テクノロジー
- 2024/05/06
1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステムは、自然言語入力を通じて、さまざまな形態の組織化された知識と相互作用します。下図では、ユーザーが「アメリカの大統領は誰ですか？」と尋ねると、システムは回答のためにLLMに質問を直接渡しません。代わりに、ユーザーの質問について、知識ベース (Wikipediaなど) でベクトル検索を実施します。意味的な類似性マッチングを通じて関連するコンテンツを見つけ (たとえば、「バイデンは現在の第46代アメリカ合衆国大統領です...」)、LLMに発見した知識とともにユ
- RAG
- LLM
- AI
- ドキュメント
- 機械学習
- あとで読む
ローカルLLM on iOS の現状まとめ
- 38 users
- zenn.dev/shu223
- テクノロジー
- 2024/04/25
2024年3月5日に開催されたイベントで発表した内容です。スライドはこちら：またLTで全然時間が足りなかったので、イベント終了後にひとりで撮ったプレゼン動画がこちら：以下、発表資料を記事として再構成したものになります。登壇後に調査した内容も追記しています。「ローカルLLM on iOS」のデモオンデバイスで [1]処理してます APIは叩いていません倍速再生していません 8.6 tokens/sec iOSローカルでLLMを動かすメリットオフラインでも動くプライバシーが守られる（データがどこにもアップされない）どれだけ使っても無料モバイル端末スタンドアローンで最先端の機能が動作することには常にロマンがある iOSでローカルLLMを動かす方法大きく分けて2つ llama.cpp Core ML llama.cpp LLMが高速に動くランタイム C/C++製 Georgi
- LLM
- iOS
- 機械学習
- Apple
- あとで読む
GPT-4 Turboより3倍速い「日本語特化のGPT-4」が提供開始、トークンも削減／
- 38 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/04/15
- 人工知能
- 文章生成AI
- GPT
- あとで読む
- techfeed
- AI
- ダジャレ
日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita
- 38 users
- qiita.com/wayama_ryousuke
- テクノロジー
- 2024/04/10
TL;DR 量子化しても成績が下がりにくいモデルと、大きく下がるモデルがある一部のモデルは量子化すると回答が極端に短くなる量子化によって回答が短くなる度合いは、量子化前モデルの回答の長さと相関がある可能性があるはじめに皆さんは量子化したLLMを使っていますか？深層学習における量子化（quantization）とは、モデルのパラメータを少ないビット数で表現することです。通常のモデルは float32 などの高精度なデータ型を使ってパラメータを表現しますが、この精度を float16 や int8 に下げることを量子化といいます。量子化による最大のメリットは、モデルのメモリ使用量を削減できることです。メモリの大きなモデルを動かすためには、大容量のメモリを搭載したGPUが必要ですが、量子化によってモデルのメモリ使用量を削減することで、より多くのGPUでモデルを動かすことができます
言語モデルを高位合成でFPGAに実装してみた
- 37 users
- zenn.dev/turing_motors
- テクノロジー
- 2024/04/24
言語モデルを高位合成でFPGAに実装してみた Turing株式会社のリサーチチームでインターンしているM1の内山です。 Turing株式会社では大規模基盤モデルによる完全自動運転を目指しており、その実現に欠かせない技術として大規模言語モデルの研究開発を行っています。 Generative AI LLMの広範な知識と思考能力に加え、視覚情報やセンサーデータなどの多様な入力を受け入れることで、車の周囲の状況を正確に認識します。さらに、世界モデルを適用することで、高度な空間認知と身体性を獲得し、実世界に対応した生成AIを実現します。 https://tur.ing/ より引用しかしながら、従来の大規模モデルはデータセンターという大量のGPU・潤沢な電源・安定した地盤を備えた豊かな環境で処理されるものであり、対して自動車というものは余りにも狭く、電源が乏しく、振動が大きいという劣悪極まりない環境
- FPGA
- LLM
- CPLD
- 人工知能
- 言語
- あとで読む
GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表
- 37 users
- gigazine.net
- テクノロジー
- 2024/04/15
Googleの研究者が、大規模言語モデル(LLM)に無限の長さのテキストを処理させる手法だという「Infini-attention」に関する論文を発表しました。 [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143 Google’s new technique gives LLMs infinite context | VentureBeat https://venturebeat.com/ai/googles-new-technique-gives-llms-infinite-context/ Google Demonstrates Method to Scale Languag
米Apple、iPhoneのUIを理解するモバイル専用AI言語モデル「Ferret-UI」発表　GPT-4V越えの性能
- 37 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/12
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X：＠shiropen2 米Appleに所属する研究者らが発表した論文「Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs」は、iPhoneやAndroidなどのモバイルUI画面をより深く理解し、インタラクションできるように設計されたマルチモーダル大規模言語モデル（MLLM）を提案した研究報告である。 Ferret-UIは、モバイルUIの画面上で、多様な入力形式（点、ボックス、スケッチ）を用いて参照タスク（ウィジェット分類、アイコン認識、OCRなど）を実行し、グラウンディングタスク（ウィジェット検索、
- 人工知能
- iPhone
- techfeed
- iPad
- AI
- あとで読む
饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました｜Baku
- 36 users
- note.com/bakushu
- テクノロジー
- 2024/04/16
最近LLMコミュニティから生まれた小型MoEモデル「LightChatAssistant-2x7B」の日本語チャット性能がとても良いため、モデル作者さんが用いた手法（Chat Vector+MoEマージ）を後追いで勝手に検証しています。その過程で複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。以下はこのモデルの簡単な説明です。簡易評価日本語によるinstruction-tuningを行ったモデルの評価用データセットとして知られる「ELYZA-tasks-100」を用いて、ほかの有力な7Bクラスの日本語モデルとスコアを比較しました。その結果、GPT-4による評価において既存の日本語7Bモデルより大幅に高いスコア（3.42）を示すことが確認できました。単純に
LangChainを用いた4種類のRAG質問応答chainの実装と性能比較
- 35 users
- zenn.dev/aidemy
- テクノロジー
- 2024/04/24
はじめにこの記事で想定している読者の方: LangChainで簡単でもコードを書いたことがある人 LLM chainについてざっくりと理解している人公開されているLLMをapi経由で用いて様々な処理を記述できるライブラリ「LangChain」にて, 主に外部から文書を与える際に用いられる以下の4つのchainをご存知の方も多いと思います。 stuff chain map reduce chain map rerank chain refine chain 今回は, 実際にstreamlitを用いて4つのchainを使用したchatアプリのデモ作成し, それを用いてchainごとの性能比較を行いました! 比較では単純な応答能力の比較に加えて, 生成時間やAPI料金の観点からも比較を行なったので, ぜひ読んでみてください! TL;DR 今回の実験は以下のgif画像のようなデモアプリを用い
- Python
- あとで読む
継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development
- 34 users
- tech.preferred.jp
- テクノロジー
- 2024/04/17
この記事は、金融チームエンジニアの今城(@imos)と金融チームリサーチャーの平野(@_mhirano)による寄稿です。概要本稿では、ドメインに特化したLLMの構築の一環として、金融ドメイン特化のLLMの構築の検証を行いました。継続事前学習によるドメイン知識の獲得を模索し、特定のドメイン向けに専用のパラメータ数が多い高性能なLLMを提供を可能にすることを目指します。実験では、nekomata-14bとPFNで構築した金融に特化したデータセットを用いて、継続事前学習を実施しました。継続事前学習の結果として、金融ベンチマーク性能が向上することが確認できました。出力の差としては、Instruction Tuningを施していないため、大きな差は見られないものの、一定の差が見られるケースもありました。継続事前学習後のモデルは、https://huggingface.co/pfnet/n