言語処理の人気記事 19件 - はてなブックマーク

1 - 19 件 / 19件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

言語処理の検索結果1 - 19 件 / 19件

最近ローカルLLMがアツいらしい
- 1015 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2024/05/20
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し
- AI
- LLM
- あとで読む
- ChatGPT
- 人工知能
- 機械学習
- IT
- mac
- API
- GPU
AIラジオ『zenncast』の技術構成（プロンプトつき）
- 350 users
- zenn.dev/himara2
- テクノロジー
- 2024/05/16
先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。このZennではzenncastの技術構成や仕組みを紹介します（プロンプトつき）。作ったものまずはエピソードを一つ選んで1分くらい聴いてみてください！ AIラジオの雰囲気が掴めると思います。主な機能・特徴毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify
- AI
- あとで読む
- LLM
- webサービス
- 技術
- API
- ラジオ
- エンジニア
- radio
- 人工知能
［速報］マイクロソフトが「Team Copilot」発表。生成AIが会議のファシリテーターやプロジェクト管理を実行
- 288 users
- www.publickey1.jp
- テクノロジー
- 2024/05/22
マイクロソフトは、日本時間5月22日未明から開催中のイベント「Microsoft Build 2024」で、生成AIがさまざまな業務を支援してくれる「Microsoft Copilot」の新機能として「Team Copilot」を発表しました。チームの生産性向上を実現するTeam Copilot Microsoft Copilotは、同社のオフィス製品などに組み込まれた生成AIによって文書やプレゼンテーションの作成などの支援を通じて個人の生産性向上を実現する機能として登場し……
- AI
- Microsoft
- あとで読む
- copilot
- Teams
- 仕事
- 人生
- 人工知能
- techfeed
M1MacでOllamaを試したら爆速で驚いた
- 176 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/18
はじめにいつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。スペック： Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました！結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です！ Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論ダウロードができたらシ
- LLM
- AI
- あとで読む
- mac
- 機械学習
ベクトルデータの容量を96%削減するBinary Embedding
- 90 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/05/21
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムの中では、どんな情報にアクセスするかを決定する際に、Embeddingと呼ばれる文章をベクトル化する技術が使用されています。そして多くの場合では小数(float)の多次元ベクトルが採用されています。しかし、Embeddingの中には各ベクトルの数値を1Bitのデータとして扱うBinary Embeddingというものが存在します。本記事では、Embeddingの手法の一つであるそのBinary Embeddingについて解説と検証を行います。サマリー Binary Embeddingを採用することで以下のような効果を得ることができます。保管するベクトルデータの容量を96%ほど削減で
- RAG
- AI
- DB
- 精度
- Embedding
- あとで読む
- 推薦
- recommendation
- LLM
ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
- 70 users
- zenn.dev/azookey
- テクノロジー
- 2024/05/16
こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください！ Zenzaiの概要日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。クローズドソースのシステ
- IME
- 自然言語処理
- LLM
- macOS
- AI
- 日本語入力
- mac
- あとで読む
- 人工知能
プロンプトエンジニアリングを最適化する為のフレームワークSAMMOを実際に使ってみた - Taste of Tech Topics
- 51 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/05/21
いつの間にか春も過ぎ去りすっかり夏模様の今日この頃皆さんいかがお過ごしでしょうか？菅野です。生成AIの重要性が高まり、生成AIで利用できるテキスト量が長くなるにつれてにつれて、プロンプトエンジニアリングの重要性が高まってきました。プロンプトエンジニアリングとは、そのプロンプトにどのような命令、事前情報等を入力すると、より適した応答が返ってくるかを設計する技術です。そんなプロンプトエンジニアリングを最適化する為のPythonライブラリ、SAMMOがMicrosoft社から2024年4月18日にリリースされたので紹介していきます。 www.microsoft.com SAMMOとは？ Structure-Aware Multi-objective Metaprompt Optimizationの頭文字をとったフレームワークです。元来、プロンプトエンジニアリングでは、エンジニアが、様々な
- データ
- あとで読む
- API
- tech
Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 40 users
- www.techno-edge.net
- テクノロジー
- 2024/05/20
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第47回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」 2D画像から3Dコンテンツを生成する「CAT3D」をGoogleが開発大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査画像とテキストを使った長文生成が得意なAIモデル「Chameleon」をMetaが開発 Transformerを超える「Mamba」は視覚認識タスクに必要か？　開発した「MambaOut」モデルで検証 GPU上でネイティブ動作する並列
- AI
- あとで読む
AIの仕組みであるLLMの「ブラックボックス」の内部を見てどのニューラルネットワークが特定の概念を呼び起こすかを知る試みをAnthropicが解説
- 38 users
- gigazine.net
- テクノロジー
- 2024/05/22
チャットAI「Claude」などを開発するAI企業「Anthropic」がAIモデルの内部動作について、何百万もの概念がどのように表現されているかという研究結果を報告しました。 Mapping the Mind of a Large Language Model \ Anthropic https://www.anthropic.com/research/mapping-mind-language-model AIモデルの本体である大規模言語モデル(LLM)の出力はブラックボックスとして扱われており、入力に対応して出力が行われた時になぜその特定の応答が出力されたのかは不明となっています。そのため、モデルが有害・偏見・ウソなどの危険な出力をしないことを信頼するのは難しいものです。 Anthropicは以前よりLLMの内部についての研究を行っており、2023年10月には「特徴」単位でまとめるこ
LangSmithを活用したRAGの評価・改善フローの整備
- 31 users
- speakerdeck.com/os1ma
- テクノロジー
- 2024/05/22
2024年5月22日 #mlopsコミュニティ
- あとで読む
GPT-4oとPhi-3でLLMとSLMの双方を取り込むMicrosoftのAI戦略
- 30 users
- pc.watch.impress.co.jp
- テクノロジー
- 2024/05/22
- SLM
- microsoft
- LLM
- 自然言語処理
- 人工知能
- techfeed
- AI
- あとで読む
CRDT: Text Buffer - Made by Evan
- 17 users
- madebyevan.com
- テクノロジー
- 2024/05/20
Collaboratively editing strings of text is a common desire in peer-to-peer applications. For example, a note-taking app might represent each document as a single collaboratively-edited string of text. The algorithm presented here is one way to do this. It comes from a family of algorithms called CRDTs, which I will not describe here. It's similar to the approaches taken by popular collaborative te
AIエージェントは何から取り組む？社内取り組み紹介 - AITC - ISID | AI トランスフォーメンションセンターコラム
- 17 users
- aitc.dentsusoken.com
- テクノロジー
- 2024/05/20
こんにちは！AIソリューショングループの太田です。このコラムでは生成AIエージェントは知っているが、何から始めるべきか分からない方向けに、生成AIエージェントを使った問い合わせ対応の取り組みを紹介します。さらに、私たちの生成AIエージェント開発の失敗談や工夫点も紹介しています。みなさんの今後の開発や検証の参考になれば幸いです。生成AIエージェントとは？生成AIエージェントは何ができますか？最初におすすめの検証電通総研の取り組み紹介問題設定：ヘルプデスクの一次回答挑戦的なポイント開発に利用したもの活動１）エージェントのワークフローを準備活動２）評価データセットでの精度検証と課題の洗い出し活動３）ナレッジのドキュメント化活動４）各LLMの観測範囲のチューニング活動５）計画のプロンプトエンジニアリング活動６）ツール呼び出しのチューニング活動７）振り返りのプロンプ
- LLM
- 人工知能
- techfeed
- AI
- あとで読む
GPT-4oとStreamlitでOpenAI Assistants APIのCode Interpreterを検証した現状と課題
- 12 users
- zenn.dev/seiya303
- テクノロジー
- 2024/05/19
はじめに OpenAIのAssistants APIをそのまま使用することで、自前でLangChainのエージェントなどを使用して同様の処理を実装する手間を省け、非常に便利です。ただ、現状（2024/05/18）ではまだβ版ということもあり、APIのインタフェースの改変も多く見られます。 Assitants APIを用いたcode-interpreterのUIをstreamlitで実装においても、実装例が紹介されていますが、そのままでは動作しないこともあり、最新版での動作検証も兼ねてStreamlitでの実装例を紹介します。また、本記事ではStreaming対応済みの実装を取り入れており、よりリアルタイムな対話が可能となっています。扱っているモデルは2024/05/14に発表されたGPT-4oを用いています。目次はじめに実装例 app.py openai_handler.py
- あとで読む
Microsoft、マルチモーダルなSLM「Phi-3-vision」をプレビュー
- 8 users
- www.itmedia.co.jp
- テクノロジー
- 2024/05/22
米Microsoftは5月21日（現地時間）、開発者向け年次開発者会議「Microsoft Build 2024」の基調講演で、SLM（小規模言語モデル）「Phi-3」ファミリーの新メンバー「Phi-3-vision」（以下「vision」）を発表した。画像を解析するマルチモーダルなSLMだ。プレビュー版を利用可能。 SLMは単純なタスクで適切に実行できるように設計されており、リソースが限られる組織や端末上でローカルに実行する必要があるアプリに適した言語モデルだ。 visionは、描画はできないが、モバイル端末で利用可能なコンパクトさだ。42億パラメータモデルで、グラフや画像に関して質問すると、それについて説明してくれる。 Microsoftは「visionは画像とテキストを一緒に検討する必要があるタスクに最適だ」としている。多様なハードウェアで実行できるように最適化されており、開発者はモ
- Microsoft
Chat VectorでLLaVAを日本語対応させる
- 5 users
- zenn.dev/toshi_456
- テクノロジー
- 2024/05/20
import torch from transformers import AutoTokenizer, AutoModelForCausalLM from llava.model.builder import load_pretrained_model if __name__ == "__main__": vlm_model_name = "liuhaotian/llava-v1.5-7b" vlm_tokenizer, vlm_model, image_processor, context_len = load_pretrained_model( model_path=vlm_model_name, model_base=None, model_name="llava-v1.5-7b", load_bf16=True, device_map="cpu", device="cpu" )
- 日本語
- 機械学習
microsoft/Phi-3-vision-128k-instruct · Hugging Face
- 5 users
- huggingface.co
- テクノロジー
- 2024/05/22
Intended Uses Primary use cases The model is intended for broad commercial and research use in English. The model provides uses for general purpose AI systems and applications with visual and text input capabilities which require memory/compute constrained environments; latency bound scenarios; general image understanding; OCR; chart and table understanding. Our model is designed to accelerate res
- Microsoft
- あとで読む
New models added to the Phi-3 family, available on Microsoft Azure | Microsoft Azure Blog
- 5 users
- azure.microsoft.com
- テクノロジー
- 2024/05/22
Explore Azure Get to know Azure Discover secure, future-ready cloud solutions—on-premises, hybrid, multicloud, or at the edge Global infrastructure Learn about sustainable, trusted cloud infrastructure with more regions than any other provider Cloud economics Build your business case for the cloud with key financial and technical guidance from Azure Customer enablement Plan a clear path forward fo
- Microsoft
- あとで読む
OpenAIのGPT-4のアーキテクチャへの仮説：Mixture Of Experts(MoE)による拡張性の高いLLM｜鈴木いっぺい (Ippei Suzuki)
- 3 users
- note.com/ippei_suzuki_us
- テクノロジー
- 2024/05/20
OpenAI社のGPT-4は、従来のGPT-3, GPT-2.5と比較して巨大な言語モデル持ち、パラメタ数でいうと1,750億〜2,800億個、とされています。これはデータ量で言うと45GBに及びます（従来のGPT-3はその1／3近くの17GB）。データ量が多くなった分、精度や正確性は高くなったと評価されてますが、ハルシネーションによる間違った回答の比率が少なくなったかと言うとそうでも無い、と言う意見も多いし、人間の思考の様な推論（reasoning）がまだ十分にできない、と言うことも根本的な課題です。 AIシステムのパラメタが巨大化する最大の課題は、それをトレーニングするためのコストが著しく高くなってしまう、という事。この辺のスタディはかなりされていると思いますが、この課題を解決する方法の一つとして、MoE (Mixture of Experts) アーキテクチャ、と呼ばれるニューラル