Llamaの人気記事 63件 - はてなブックマーク

1 - 40 件 / 63件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Llamaの検索結果1 - 40 件 / 63件

最近ローカルLLMがアツいらしい
- 1044 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2024/05/20
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し
- AI
- LLM
- あとで読む
- ChatGPT
- 機械学習
- 人工知能
- mac
- IT
- API
- GPU
Open Interpreterの使い方や料金を徹底解説！実際にアンケート結果のデータ分析をした活用事例を紹介！｜Ainova
- 318 users
- generativeinfo365.com
- テクノロジー
- 2023/09/11
1. インストール 1pip install open-interpreter ターミナルで次のコマンドを実行して、Open Interpreter をインストールします。 2. 対話型チャットの開始インストール後、次のコマンドを実行して、ターミナルで対話型チャットを開始できます。 1interpreter Python で対話型チャットを開始するには、次のコマンドを実行します。 1import interpreter 2interpreter.chat() 2. OpenAI APIキーの設定 OpenAIのAPIキーを利用する場合は設定が必要ですが、OpenAIのキーを使用しない場合は、Code-Llamaを利用することができます。これで、Open Interpreterを利用する準備が整いました。 Open Interpreterの使い方タスクの依頼・実行 Open Inter
- ChatGPT
- あとで読む
- AI
- GPT
- LLM
- ツール
- OpenAI
- プログラミング
- LLaMA
- 自然言語処理
無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携
- 289 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/19
米Metaは7月18日（現地時間）、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT（の3月1日版）と互角」（同社）という。ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習（ファインチューニング）したモデルを用意する。いずれも4096トークン（おおよそ単語数の意）まで文脈を読める。性能は、Llama-2-70b-chat（700億のチャット
- AI
- ChatGPT
- あとで読む
- Meta
- 人工知能
- Llama
- LLM
- microsoft
- 機械学習
- 無料
いちばんやさしいローカル LLM｜ぬこぬこ
- 283 users
- note.com/schroneko
- テクノロジー
- 2024/04/21
概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、
- LLM
- あとで読む
- AI
- ChatGPT
- 人工知能
- 自然言語処理
- mac
- モデル
- 機械学習
東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
- 231 users
- news.mynavi.jp
- テクノロジー
- 2024/01/13
東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。同成果は、東工大情報理工学院情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日本語能力の改善を担当したとしている。産総研のAI橋渡しクラウド「ABCI」(出所:東工
- LLM
- あとで読む
- AI
- 日本語
- 言語モデル
- 研究
- 人工知能
- 言語
- 学習
- 自然言語処理
意外と良くなってきてしまった動画生成と音楽生成。第二回AIアートグランプリはどうなる!?
- 216 users
- wirelesswire.jp
- テクノロジー
- 2023/08/13
意外と良くなってきてしまった動画生成と音楽生成。第二回AIアートグランプリはどうなる!? 2023.08.13 Updated by Ryo Shimizu on August 13, 2023, 11:41 am JST ほんの一ヶ月前まで、動画生成は全然だめだった。 Gen2は高価だが狙ったものを出しにくい。何より動いてくれない。ところがAnimateDiffという技術が公開された。これはとても激しく、それっぽく動く。コツは必要だが、以前よりずっと綺麗に動いているのは間違いない。筆者の運営するサイトMemeplexやreplicateで使うことができる音楽生成も、「やはりAIに音楽みたいな人間の機微を読み取るようなものは無理か」と考えていた。「専門家」である僕でさえ、つい一ヶ月ほど前はそうだったのだ。新しいオーディオ生成モデルである「JEN-1」と「AudioLDM2」はそ
- AI
- あとで読む
- 人工知能
- Llama
- 技術
- GPT
- OpenAI
- 動画
- 音楽
- 機械学習
オープンソースの定義にこだわるのはもう無意味なのか？ - YAMDAS現更新履歴
- 197 users
- yamdas.hatenablog.com
- テクノロジー
- 2023/08/21
[2023年8月22日追記]：松尾研究室の投稿にあるように、問題のプレスリリースは修正がなされ、「オープンソース」の記述は削除されている。 weblab.t.u-tokyo.ac.jp 東京大学松尾研究室が大規模言語モデル（LLM）を公開というニュースが先週話題となったが、「商用利用不可のオープンソース」という記述に「商業利用できない」のであれば、オープンソースではないという突っ込みがすかさずあがり、佐渡秀治さんも「座視することが難しい」と意見表明している。ワタシもこれらの意見に賛成である（事実そうした声を受けて、ITmedia などは記事の記述を改めている）。ただ、この話題にすっぽり重なる文章を少し前に見て、居心地が悪い思いをしていたので、それを紹介しておきたい。 www.infoworld.com 「オープンソースのライセンス戦争は終わった」というタイトルだが、どういう文章なのか？
- OSS
- あとで読む
- license
- LLM
- ライセンス
- MongoDB
- 世代
- オープンソース
- tech
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました｜ELYZA, Inc.
- 180 users
- note.com/elyza
- テクノロジー
- 2023/08/29
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開既に社内では、130億、700億パラメータのモデルの開発も進行中はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「
- LLM
- AI
- あとで読む
- 機械学習
- 開発
- 自然言語処理
- 日本語
- 人工知能
- 学習
- 勉強
Llama
- 168 users
- ai.meta.com
- テクノロジー
- 2023/07/19
Llama is the next generation of our open source large language model, available for free for research and commercial use.
- AI
- LLM
- あとで読む
- meta
- llama
- GPT
- 自然言語処理
- 機械学習
- 人工知能
わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法
- 145 users
- gigazine.net
- テクノロジー
- 2023/12/10
「llamafile」は大規模言語モデルのモデルやウェイトの情報が1つの実行ファイルにまとまった形式のファイルです。Linux・macOS・Windows・FreeBSD・NetBSD・OpenBSDという6つのOS上でインストール不要で大規模言語モデルを動作させることが可能とのことなので、実際にWindowsおよびLinuxディストリビューションの1つであるDebian上で動かしてみました。 Mozilla-Ocho/llamafile: Distribute and run LLMs with a single file. https://github.com/Mozilla-Ocho/llamafile#readme Introducing llamafile - Mozilla Hacks - the Web developer blog https://hacks.mozilla
- 人工知能
- あとで読む
- AI
- Linux
- LLM
- techfeed
- モデル
- tech
さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場
- 144 users
- gigazine.net
- テクノロジー
- 2023/10/21
「Mistral」「Llama 2」「Vicuna」などオープンソースの大規模言語モデルを簡単にローカルで動作させることが可能なアプリ「Ollama」の公式Dockerイメージが登場したので、早速使い勝手を試してみました。 Ollama is now available as an official Docker image · Ollama Blog https://ollama.ai/blog/ollama-is-now-available-as-an-official-docker-image Ollamaで動作可能な大規模言語モデルの代表例は下記の通り。リストの全体についてはOllamaの公式サイトで確認することができます。モデルパラメーターサイズDownloadMistral7B4.1GBollama run mistralLlama 27B3.8GBollama run ll
- docker
- 人工知能
- あとで読む
- AI
- コンテナ技術
- techfeed
- LLM
- モデル
ChatGPT（3.5）に匹敵する「Llama 2」をローカルPCで動かしてみた
- 83 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/31
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。このLlama 2、GPT-3.5の3月1日時点のモデルに匹敵する性能を持っているというのがウリです。GPT-3.5といえば、無料版のChatGPTで使われているモデルです。それがオープンソースとして公開されたのですから、衝撃的です。さらに、高性能なだけでなくモデルサイズが小さいことも特徴です。GPT-3のパラメータ数は1750億（175B）、GPT-3.5は未公開ではあるものの3550億（355B）と推定されています。一方で、Llama 2は、700億（70B）パラメータで、GPT-3.5並をうたっています。パラメータが小さくなれば必要なGPUのメモリも小さくなります。GPT-3.5はデー
- LLaMA
- LLM
- AI
- ChatGPT
- 人工知能
- 機械学習
- あとで読む
- テクノロジー
経済情報特化の生成AI、日経が開発　40年分の記事学習 - 日本経済新聞
- 75 users
- www.nikkei.com
- テクノロジー
- 2024/04/24
日本経済新聞社は24日、経済情報に特化した生成AI（人工知能）の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」が130億と700億の2種類がある。日本経済新聞社の研究開発組織である日
- AI
- LLM
- あとで読む
- 人工知能
- マスコミ
- technology
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
- 65 users
- gigazine.net
- テクノロジー
- 2024/05/29
画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars | by Aksh Garg | May, 2024 | Medium https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee 今回発表されたLlama 3-Vは、 Metaが公開した言語モデルの「L
- llama
- ai
- llm
- 人工知能
- GPT
- あとで読む
- techfeed
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
- 61 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/19
米Metaは4月18日（現地時間）、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で間もなく利用可能になる。昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル（こちらはまだ公開されていない）のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5％以上が非英語データで構成されて
Meta、テキストプロンプトで作曲できる生成AIスイート「AudioCraft」をオープンソース化
- 58 users
- www.itmedia.co.jp
- テクノロジー
- 2023/08/03
米Metaは8月2日（現地時間）、テキストプロンプトから音楽や音声を生成する生成AIツールスイート「AudioCraft」をオープンソース化したと発表した。トレーニングに使うデータの多様化もオープンソース化のねらいの1つだ。 AudioCraftは、エフェクトやサウンドスケープを生成する「AudioGen」、テキストからメロディーを生成する「MusicGen」、ニューラルネットワークベースのオーディオ圧縮コーデックの「EnCodec」の3つのコンポーネントで構成されている。MusicGenは単体で6月にオープンソース化されている。EnCodecは昨年11月に公開済みだが、最近の改良でより高品質な音楽生成が可能になったという。 MusicGenは、Metaが所有する音楽と、「この目的のために特別にライセンスを取得した音楽」をあわせて2万時間分のデータでトレーニングしたとしている。 Metaは
- AI
- Meta
- あとで読む
- 音楽
僅か2.3GBで日本語可能な超高性能ローカルLLMのPhi-3 MINIをllama.cppとCPUで動かしてみた。スマホでも可。従来のコンパクトLLMと比較して超越した性能で未来を感じさせるMicroSoft寄付ありがとう
- 57 users
- togetter.com
- テクノロジー
- 2024/04/25
Kapper@Linuxガジェヲタ＆異世界小説家＆生成AI＆電子工作大好き @kapper1224 昨日MicroSoftからリリースしたローカルLLMモデルのPhi-3 mini 4k Q4をllama.cppのサーバ版を動かしてみた。こいつ2.32GBしかないくせに日本語しゃべれるぞ。今までとは桁違いの性能なんですけど・・・ ./build/bin/server -m ../Phi-3-mini-4k-instruct-q4.gguf -n 128 huggingface.co/microsoft/Phi-… pic.twitter.com/DTmUmeh7JE 2024-04-24 22:46:51
- LLM
- あとで読む
- CPU
- microsoft
Meta Llama 3
- 56 users
- llama.meta.com
- テクノロジー
- 2024/04/19
Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.
- meta
- llama
- AI
- LLM
- あとで読む
- 人工知能
- tech
- programming
Llama 2 をDocker使ってローカルで動かす
- 55 users
- zenn.dev/karaage0703
- テクノロジー
- 2023/07/20
Llama 2 発表！ Metaから商用利用可能なライセンスでオープンなLLMであるLlama 2が発表されました。こりゃすごそうだけど、しばらくは様子見かなーと思っていたら、npakaさんが一瞬で動かしているではありませんか。こりゃやるしかないと、ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの仮想環境の準備」を詳しく書いたものです。 DockerでLlama 2を動かす Dockerファイルは、以下リポジトリに格納してあります。セットアップ方法は、以下参照ください。Linux/Windows前提です。Mac(Apple Silicon)では残念ながら今のところ動きませんでした。 Macでも動きますが、時間が非常にかかるので実用的ではないです。 Dockerのイメージ作成（ビルド）まで実施したらOKです。続いて量子化されたモデルlla
- llama
- docker
- LLM
- あとで読む
- AI
【Youri 7B】日本最高峰の精度を叩き出す！学習量2兆トークン超えの最強日本語LLM | WEEL
- 45 users
- weel.co.jp
- テクノロジー
- 2023/11/03
【Youri 7B】日本最高峰の精度を叩き出す！学習量2兆トークン超えの最強日本語LLM 2023 11/09 Youri 7Bは、2023年10月31日に日本のrinna社が公開した最新の日本語LLMです。このモデルは、Llama2 7Bをベースに開発され、目的や環境に合わせて複数のモデルが用意されており、より多くのAI研究に活用されることを目的としています。また、量子化された軽量モデルもあるので、一般の方でも気軽に試すことができます！今回は、Youri 7Bの概要や使ってみた感想をお伝えします。是非最後までご覧ください！なお弊社では、生成AIの開発について1時間無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Youri 7Bの概要 Youri 7Bは、2023年10月31日に日本のrinna社が公開した最新の日本語LLMで、Meta社の
- LLM
- 日本語
- あとで読む
- 学習
Llama.cpp で Llama 2 を試す｜npaka
- 43 users
- note.com/npaka
- テクノロジー
- 2023/07/19
「Llama.cpp」で「Llama 2」を試したので、まとめました。・macOS 13.4.1 ・Windows 11 前回 1. Llama.cpp「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。特徴は、次のとおりです。・依存関係のないプレーンなC/C++実装・Appleシリコンファースト (ARM NEON、Accelerate、Metalを介して最適化) ・x86アーキテクチャのAVX、AVX2、AVX512のサポート・Mixed F16/F32精度・4bit、5bit、8bit量子化サポート・BLASでOpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/AC
- 機械学習
- LLM
- Python
- C++
- 人工知能
Swallow – TokyoTech-LLM
- 43 users
- tokyotech-llm.github.io
- テクノロジー
- 2023/12/19
Swallow Llama 2の日本語能力を強化した大規模言語モデル (7B, 13B, 70B) です。モデルのパラメータ（重み）が公開されていますので、LLAMA 2 Community Licenseに従う限り、研究や商業利用など自由に利用できます。 View on HuggingFace 大規模言語モデルSwallowは東京工業大学情報理工学院の岡崎研究室と横田研究室、国立研究開発法人産業技術総合研究所の研究チームで開発された大規模言語モデルです。英語の言語理解や対話で高い能力を持つ大規模言語モデルLlama 2 7B, 13B, 70Bの日本語能力を拡張するため、研究チームは言語モデルに日本語の文字や単語などの語彙を追加したうえで、新たに開発した日本語データを用いてモデルの構築を継続的に行う継続事前学習を行いました。研究チームで実施した性能評価では、2023年12月現在オープンな
- LLM
- 機械学習
- AI
- language
- 人工知能
- 学習
- あとで読む
- 日本語
llama2のファインチューニング(QLORA)のメモ｜Kan Hatakeyama
- 40 users
- note.com/kan_hatakeyama
- テクノロジー
- 2023/07/21
2023/11/13追記以下の記事は､Llama2が公開されて数日後に書いた内容です｡公開から数ヶ月経った23年11月時点では､諸々の洗練された方法が出てきていますので､そちらも参照されることをおすすめします｡ (以下､元記事です) 話題のLamma2をファインチューニングします｡ QLoRAライブラリを使うパターンと､公式推奨の2つを試しました｡前者が個人的にはオススメです｡前提Hugging faceで配布されている公式のモデルが必要です｡以下を参考に､ダウンロードしておきます｡データセット作成 (7/20 15:20追記設定ミスってたので修正しました) test.jsonを適当に作ります｡ [ { "input": "", "output": "### Human: 富士山といえば?### Assistant: なすび" }, { "input": "", "output":
700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました｜ELYZA, Inc.
- 39 users
- note.com/elyza
- テクノロジー
- 2024/03/12
700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しましたはじめにこの度 ELYZA は、新たに開発した700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」のデモを公開しました。「ELYZA-japanese-Llama-2-70b」は、前回までに引き続き、英語の言語能力に優れた Meta 社の「Llama 2」シリーズに日本語能力を拡張するプロジェクトの一環で得られた成果物です。 ELYZA が公開している日本語ベンチマーク ELYZA Tasks 100 を用いたブラインド性能評価では、公開されている日本語の大規模言語モデル (以下、LLM) を大きく上回っていることに加え、OpenAI 社の「GPT-3.5 Turboシリーズ」や Anthoropic 社の「Cla
- LLM
- AI
- あとで読む
- 日本語
- 人工知能
- techfeed
Google Colab で Llama 2 を試す｜npaka
- 37 users
- note.com/npaka
- テクノロジー
- 2023/07/19
「Google Colab」で「Llama 2」を試したので、まとめました。 1. Llama 2「Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 2. モデル一覧「Llama 2」は、次の6個のモデルが提供されています。 (hfでないモデルも存在) ・meta-llama/Llama-2-70b-hf ・meta-llama/Llama-2-70b-chat-hf ・meta-llama/Llama-2-13b-hf ・meta-llama/Llama-2-13b-chat-hf ・meta-llama/Llama-2-7b-hf ・meta-llama/Llama-2-7b-chat-hf 3. 利用申請「Llama 2」を利用するには、利用申請が必要です。 (1) 公式のMetaのフォームから利用申請。数時間後に利用許可のメールがきます。 (
- LLM
- LLaMA
- AI
- Google
- oss
- 人工知能
- あとで読む
Llama 2の性能がGPT-3.5並みだというのが本当かテストしてみた｜IT navi
- 35 users
- note.com/it_navi
- テクノロジー
- 2023/07/20
１．Llama 2の日本語能力最初に、Llama 2に日本語で話しかけてみました。入力　こんにちは。日本語は話せますか？ LLama 2　Konnichiwa! Yes, I can speak Japanese. How may I assist you today? （こんにちは。はい、日本語が話せます。今日はどのようなご用件でしょうか？）入力　富士山はどんな山ですか？ Llama 2　Fuji-san is a very famous mountain in Japan, known for its beautiful and iconic shape. It is a stratovolcano, which means it is a type of volcano that is characterized by its steep, conical shape and i
- Llama
- LLM
- 人工知能
- 日本語
- あとで読む
m1 MacbookにLlama 2をインストールして使ってみる | DevelopersIO
- 34 users
- dev.classmethod.jp
- テクノロジー
- 2023/07/31
支給されているPC(m1 Macbook)を使ってローカルでLlama 2を動かしてみるまでの記録です。 AppleシリコンのMacでもLlama 2をつかえるようにするLlama.cppというプロジェクトがあるので、これを利用させてもらいました。 Llama.cppはLlamaをC/C++に移植したもので、Mac上で4ビット整数量子化を使ってLlama 2をローカルに実行できるようにしたものです Llama 2のモデルはmetaのダウンロードリンクから取得しています。準備作業用のディレクトリを作成して行います。 $ mkdir llama2 $ cd llama2 Llama 2, Llama.cppのgithubレポジトリをcloneしておきます。 $ git clone https://github.com/facebookresearch/llama.git $ git clo
- LLaMA
- あとで読む
- mac
- モデル
ローカルでLLMの推論を実行するのにOllamaがかわいい
- 33 users
- zenn.dev/seya
- テクノロジー
- 2024/01/30
ローカルでLLMを動かそうとなったら transformers ライブラリ、llama.cpp、text generation webuiなどいくつかの選択肢があると思いますが、どれもめちゃくちゃハードルが高いというほどではないですが、動かすまでの手続が若干いかつい印象があります。そんな中で Ollama というツールを試してみたところインターフェイスがシンプル、ついでにキャラクターのラマが可愛いのでご紹介していこうと思います。ちなみにですが、日本語での言及はあまり見かけなかったですが、LangChain が出してるレポートでは OSS モデルを動かすのに使われているものとしては3番目に多く使われており、出典: LangChain State of AI 2023 GitHub のスター数も現在約33700とかなり人気を集めていそうです。 Ollama で CLI から推論では早速
- LLM
- Ollama
- Llama
- 生成AI
- AI
- あとで読む
- oss
Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される
- 31 users
- gigazine.net
- テクノロジー
- 2023/08/21
デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。 Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak https://torrentfreak.com/anti-piracy-group-takes-prominent-ai-training-dataset-books3-offline-230816/ Revealed: The Authors Whose Pirated Books Are P
- meta
- AI
- 人工知能
- Copyright
- 著作権
- book
【西川和久の不定期コラム】 340億パラメータのLLMは手元のPCで動く？Metaの「Code Llama 34B」を試してみた！
- 31 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/09/29
- LLM
- AI
- あとで読む
- 人工知能
- techfeed
- PC
【Zephyr 7B Alpha】HuggingFaceがLlama 2を超えるLLMを出したので、比較レビューしてみた | WEEL
- 30 users
- weel.co.jp
- テクノロジー
- 2023/10/13
Zephyr 7b Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bのファインチューニングモデルで、なんと10倍ほどモデルサイズが大きいChat Llama 70Bと同等の性能を持っています。ファインチューニングで10倍の差を埋めるのはすごいですよね！今回は、Zephyr 7b Alphaの概要や仕組み、実際に使ってみた感想をお伝えします。是非最後までご覧ください！なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Zephyr 7b Alphaの概要 Zephyr 7B Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bをファインチューニングしたモデルです。このモデルは、いくつかのベンチマークでChat Llama
- LLM
- LLaMA
- AI
- あとで読む
- モデル
［速報］マイクロソフト、Metaの最新大規模言語モデル「Llama 2 」をAzureとWindowsでサポート。独自の生成的AIを開発可能に
- 28 users
- www.publickey1.jp
- テクノロジー
- 2023/07/19
オープンソースで商用利用も可能な大規模言語モデル Llama 2はこのマイクロソフトの発表とほぼ同時にMetaが発表した最新の大規模言語モデルです。オープンソースとして公開され商用利用も可能で、AI分野で高い実績を残してきたMetaが満を持して公開するモデルとして高い能力を備えていることが期待されています。 Llama 2はパラメータ数が7B、13B、70Bの3つのモデルに分かれており、Microsoft Azureではこの3つのモデルを現在パブリックプレビュー中のAzure AIモデルカタログから選択し、ファインチューニングし、デプロイが可能。また、Windowsマシン上でもLlama 2が実行できるように最適化される予定です。これらにより開発者は独自の生成的AIをMicrosoft AzureやWindows上で開発し、アプリケーションに組み込めるようになります。マイクロソフト
- Meta
- Azure
- LLM
- AI
- Microsoft
- 文章
- 人工知能
商用利用可能で130億パラメーターの日本語LLM「ELYZA-japanese-Llama-2-13b」が公開／デモも公開されており、実際に能力を試すことが可能
- 27 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/12/27
- AI
- LLM
- 人工知能
- 日本語
- techfeed
- あとで読む
Introducing Code Llama, a state-of-the-art large language model for coding
- 20 users
- ai.meta.com
- テクノロジー
- 2023/08/24
Today, we are releasing Code Llama, a large language model (LLM) that can use text prompts to generate code. Code Llama is state-of-the-art for publicly available LLMs on code tasks, and has the potential to make workflows faster and more efficient for current developers and lower the barrier to entry for people who are learning to code. Code Llama has the potential to be used as a productivity an
- meta
- llama
- Python
- 機械学習
- あとで読む
- AI
Llama2の70Bモデルを4bit量子化して1GPUで実行する方法 - TadaoYamaokaの開発日記
- 19 users
- tadaoyamaoka.hatenablog.com
- テクノロジー
- 2023/07/22
個人メモ Hugging Faceで公開されているLlama2のモデルを使用して、4bit量子化を有効にして、70Bのモデルを1GPU(A100)で推論する方法について記述する。 dockerコンテナ作成 NVIDIAのPyTorchイメージを使用してDockerコンテナを作成する。 ※ホストのドライババージョンが古いため、少し前のイメージを使用している。コマンド例 docker run --gpus all --network host -v /work:/work -w /work -it nvcr.io/nvidia/pytorch:22.12-py3 PyTorchバージョンアップ xformersがpytorch 2.0.1を要求するためPyTorchをアンインストールしてからインストール pip uninstall torch torchvision torchtext to
Meta’s LLaMa 2 license is not Open Source
- 18 users
- opensource.org
- テクノロジー
- 2023/07/21
Meta’s LLaMa 2 license is not Open Source OSI is pleased to see that Meta is lowering barriers for access to powerful AI systems. Unfortunately, the tech giant has created the misunderstanding that LLaMa 2 is “open source” – it is not. Even assuming the term can be validly applied to a large language model comprising several resources of different kinds, Meta is confusing “open source” with “resou
- llm
- oss
Meta、商用利用可能なオープンソースLLM「Llama 2」を提供開始　「MPT」や「Falcon」を上回る成績
- 17 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2023/07/21
Metaは2023年7月18日（米国時間）、次世代のオープンソース大規模言語モデル（LLM）「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。 Llama 2は、同社が2023年2月に研究者向けに公開し、高い需要がある「Llama 1」の次期バージョン。開発者や組織が生成AIを活用したツールや体験を構築できるように設計されており、70億、130億、700億パラメーターの3つのサイズのモデルがある。公開されているオンラインデータソースを用いて、Llama 1より40％多い2兆トークンで事前にトレーニングされており、コンテキスト長はLlama 1の2倍の4096トークンとなっている。チャットやQ&Aなどの対話アプリケーション用に、これらをファインチューニングしたモデル（Llama-2-chat）も用意されている。これらは、公開されているインストラクションデー
- LLM
- あとで読む
Metaがコード生成AIモデルの新バージョン「Code Llama 70B」をリリース、コードの正確性が向上・Pythonに最適化されたバリアントも提供
- 16 users
- gigazine.net
- テクノロジー
- 2024/01/30
FacebookやInstagramを運営するMetaが、テキスト入力を元にプログラムのコードを生成するAI「Code Llama」の700億パラメータのモデルをリリースしたと発表しました。モデルはLlama 2と同じ「Llama 2 Community License」で公開されており、月間アクティブユーザー数が7億人以下の場合は無償で商用利用することが可能です。 Introducing Code Llama, a state-of-the-art large language model for coding https://ai.meta.com/blog/code-llama-large-language-model-coding/ Code LlamaはMetaが2023年7月にリリースしたLlama 2をコード固有のデータセットでさらにトレーニングしたもの。Python、C++
- meta
- python
- 人工知能
- techfeed
- AI
- programming
Perplexity Labs
- 15 users
- labs.perplexity.ai
- テクノロジー
- 2023/07/22
Playgroundpplx-apiTry PerplexityLLM served by Perplexity LabsHello! How can I help you?CopyCopy0.00 secClear Chat
【ローカルAI】GUIでCodeLlama-34B-Instruct-GGUFを動かしてみる【text-generation-webui】
- 15 users
- zenn.dev/saldra
- テクノロジー
- 2023/08/28
概要ローカルLLMで最近話題の「CodeLlama-34B-Instruct-GGUF」をtext-generation-webuiから動かし、「ローカルLLMでもファインチューニングなしでプロンプト指示できる」感覚を体験してみる。メイン読者ターゲットご家庭にGPUがある人（CPUでも良いが遅い）最適化だったり正しい理解ができてるかは別として、とりあえず動かしたい人導入から書くので、推論スピードだけ確認したい人は下まですっ飛ばしてください。導入 text-generation-webuiの導入以下からclone 自分はpyenv+venv派なので python -m venv .venv でactivate。あとは基本的にinstallationに従えば良い。数少ないポイントとして、使ってるGPUやOSによってtorchが変わること、昔のGPUだとbitsandbytes