sh2のブックマーク - はてなブックマーク

Prompt Tuning から Fine Tuning への移行時期推定

公開されている大規模言語モデルをどの程度のデータで Fine Tuning すれば Claude や ChatGPT などの API 公開されているモデルの精度に匹敵するのか検証した資料です。言語処理学会第30回年次大会併設ワークショップ日本語言語資源の構築と利用性の向上 (JLR2024) での発表資料です。実装はこちら https://github.com/aws-samples/aws-ml-jp/tree/main/tasks/generative-ai/text-to-text/evaluation/lm-evaluation-harness 先行し公開したブログ https://aws.amazon.com/jp/blogs/news/cost-efficiency-of-api-and-oss-generative-ai/

sh2 2024/03/17

面倒でも両方できるようにしておかないといけないんだな

llm

リンク

要約、翻訳ツールにGemini Proを選定した話 - Qiita

生成品質についてはどうでしょうか。Gemini ProはAnthropic、OpenAIのモデルに比べてハルシネーションが目立つのですが、要約、翻訳といったタスクは与えた情報を変換するだけですのでハルシネーションの心配はそれほどありません。冒頭に挙げたスクリーンショットと同じタスクをClaude 3 Opusで実行してみましょう。要約 Google OneのAIプレミアムプランでは、Gmail、Docs、Slides、Sheets、Meetで Geminiを使用してより創造的かつ生産的になることができる。 Google Oneは2018年の開始以来、1億人以上がサブスクライブし、Google Photosやカレンダーの高度な機能を利用している。 AIプレミアムプランでは、最大かつ最も有能なAIモデルである1.0 Ultraを使用したGemini Advancedにアクセスできる。 Gm

sh2 2024/03/13

Claude 3 Haikuが使えるようになったらそちらも試す予定

リンク

AnthropicのClaude 3 OpusのVision機能を日本語OCRとして使ってみる

今月4日、AnthropicがClaude 3を発表しました。Anthropicの発表している評価結果では、OpenAI GPT-4やGoogleのGemini 1.0 Ultraを上回る高い性能を示しています。私もClaude 3 Sonnetを使って、翻訳やテストケース作成などの作業をいくつかやってもらいましたが、私の体感でもGPT-4と同等かそれを上回る高い性能だと感じました。最近の生成AIは画像認識系機能を組み込んでおり、Claude 3もVision機能が提供されています。具体的には写真やグラフ、図などを読み込んで処理する用途が想定されているそうです。私は以前から、「Azure Computer Vision APIの日本語OCR機能を使ってみる」、「Google Cloud Vision APIの日本語OCR機能を使ってみる」、「OpenAIのGPT-4 Turbo wit

sh2 2024/03/12

Claude 3 Opusなら日本語OCRが実用になる

llm

リンク

背景削除：オンライン画像の背景透過を無料で作成｜Fotor

sh2 2024/03/11

便利

image

リンク

｢伝説のエンジニア｣が明かすエヌビディアの死角

コンテンツブロックが有効であることを検知しました。このサイトを利用するには、コンテンツブロック機能（広告ブロック機能を持つ拡張機能等）を無効にしてページを再読み込みしてください。 ✕

sh2 2024/03/04

説得力がある

ai

リンク

GitHub - kazuki-sf/YouTube_Summary_with_ChatGPT: YouTube Summary with ChatGPT is a simple Chrome Extension (manifest v3) that allows you to get both YouTube video transcripts and summary of the video with OpenAI's ChatGPT AI technology.

sh2 2024/03/04

これで勉強する

chrome

リンク

Chrome 拡張機能の CORS エラーを回避（Manifest V3） - Qiita

とても嬉しいので記事にする CORS = オリジン間リソース共有（Cross-Origin Resource Sharing）ざっくり言うと、ページに使用するソースは自分とは異なるオリジン (ドメイン、プロトコル、ポート番号) から参照する事はできませんよ、というもの。詳細は他に良い記事が沢山あるので割愛します。参考：なんとなく CORS がわかる...はもう終わりにする。で、本題。Chrome 拡張機能のマニフェストバージョンを３にすると、以前はできなかった CORS 回避が簡単にできるようになりました。これの何が嬉しいのかって言うと、拡張機能のbackground.jsなどから外部の REST API を叩こうとすると、API 側がAccess-Control-Allow-Originヘッダーを返すようにしていない限り、CORS エラーで取得できなかったり、API が JSO

sh2 2024/03/04

これで解決した。ありがとうございます

chrome

リンク

Chrome Extension を円滑に作るためのポイント

Chrome Extension を作った際にいくつかハマったことがあったのでメモします。ページ上での JavaScript 実行結果を取得する scripting.executeScript を使うのですが、関数を指定する形式のみしか値が返ってきません。ファイルを指定する形式と同じページに書かれており、制限が明確に書かれていないため紛らわしいので注意が必要です。 NG 次は実行結果が null として返ってきます。 function getTitle() { return document.title; } // returns null getTitle(); // same result // (() => getTitle())(); async function walkDocumentT itle() { const tabId = getTabId(); const inje

sh2 2024/03/03

情報思いのほか少ないので助かる

chrome

リンク

ChatGPTのプロンプトをLispで書く

ChatGPTのプロンプトをLispで書けることに気づきました。プロンプトによって処理系としてふるまってもらうという話は聞いたことがありましたが、Lispの場合はそのようなプロンプトがなくても解釈されました。モデルはGPT-4です。言語としてはClojureをベースにした擬似コードを書いています。 ※いくつか例を追加しました。思った以上にプログラミング的なことができるみたいです。単純な生成と変換の例子供っぽくする静かなヤンデレっぽくする (しっぽりやんでれ？) 対偶を返す小説を作ってそれを要約する鶏の唐揚げのレシピのJSONを生成する Lispについて執事っぽく説明するクラムチャウダーのレシピを妹として箇条書きにするお兄ちゃんとツンデレの妹の誕生日ケーキについての会話を生成する Clojureの関数を使う例 3つの文を元気にする犬の名前を5個生成してひらがなにするキリン

sh2 2024/03/02

これGemini Proで試したら同じように動いた。不思議

llm

リンク

Google Chrome拡張機能: HTMLの国際化

やりたいこと chrome.i18nではJavaScriptから呼び出す他に、 manifest.json, CSSのローカライズに対応していますが、 HTMLのローカライズは対応していません。その対応方法です。前提条件概要ローカライズしたい要素に以下のいずれかを付ける。要素の中のテキストをローカライズしたい場合(spanなど): data-i18n-text属性要素のvalueをローカライズしたい場合(inputなど): data-i18n-value属性 HTMLのこの属性を検索し、メッセージを置き換える。手順以下のような関数を作ります。 function localizeHtmlPage() { document.querySelectorAll("[data-i18n-text]").forEach(element => { const key = element.

sh2 2024/02/29

使わせていただきます

javascript

リンク

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース

sh2 2024/02/28

上手くいけばスマホやPCでできる推論がかなり良くなる

llm

リンク

systemd の Unit定義ファイルで変数を使用する方法 - Qiita

systemctlコマンドでサービスを起動する際に、Unit定義ファイル内で変数を使用する方法を紹介します。環境 OS：CentOS Linux release 7.7.1908 1. Unit定義ファイル内で変数を指定 Unit定義ファイル内でEnvironmentを使用して変数を指定することができます。ここではtest.serviceのUnit定義ファイルを作成して、確認してみます。変数TEST_VALUE1にdisplay1、変数TEST_VALUE2にdisplay2を設定します。 echoで変数を表示させます。 [Unit] Description=TestService [Service] Environment=TEST_VALUE1=display1 Environment=TEST_VALUE2=display2 ExecStart=/bin/echo ${TEST

sh2 2024/02/28

Environment=変数=値

linux

リンク

GitHub Universe Recap Tokyo

sh2 2024/02/28

事例など参考にする

llm

リンク

GitHub Copilot Enterprise is now generally available

ProductGitHub Copilot Enterprise is now generally availableOur most advanced AI offering to date is customized to your organization’s knowledge and codebase, infusing GitHub Copilot throughout the software development lifecycle. Since the early days of GitHub Copilot, our customers have asked us for a copilot that is customized to their own organization’s code and processes. Developers spend more

sh2 2024/02/28

Officeのようにほぼ全員が使うものではないから、ライセンスの付け外しをする情シスの負担が増えそうなんだよなあ

llm

リンク

ローカルでLLMの推論を実行するのにOllamaがかわいい

ローカルでLLMを動かそうとなったら transf ormers ライブラリ、llama.cpp、text generation webuiなどいくつかの選択肢があると思いますが、どれもめちゃくちゃハードルが高いというほどではないですが、動かすまでの手続が若干いかつい印象があります。そんな中で Ollama というツールを試してみたところインターフェイスがシンプル、ついでにキャラクターのラマが可愛いのでご紹介していこうと思います。ちなみにですが、日本語での言及はあまり見かけなかったですが、LangChain が出してるレポートでは OSS モデルを動かすのに使われているものとしては3番目に多く使われており、出典: LangChain State of AI 2023 GitHub のスター数も現在約33700とかなり人気を集めていそうです。 Ollama で CLI から推論では早速

sh2 2024/02/27

WSL2でもさくっと動いた

llm

リンク

k-quants by ikawrakow · Pull Request #1684 · ggerganov/llama.cpp

sh2 2024/02/27

量子化の説明

llm

リンク

女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか？

ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られたいままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。彼女は X（Twitter）の自分のアカウントで1日1本のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな！」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

sh2 2024/02/27

すごい

llm

リンク

最強DB講義 #32 大規模言語モデルを作り、拡張する -- LLM, RAG, Agents (2024/02/21 18:30〜)

お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。 2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。お知らせ connpassをご利用いただく全ユーザーにおいて健全で円滑なイベントの開催や参加いただけるよう、イベント参加者向け・イベント管理者向けのガイドラインページを公開しました。内容をご理解の上、イベント内での違反行為に対応する参考としていただきますようお願いいたします。 2月 21 最強DB講義 #32 大規模言語モデルを作り、拡張する -- LLM, RAG, Agents 講師：小山田昌史氏（日本電気株式会社）

sh2 2024/02/26

勉強になる

llm

リンク

GitHub - Zuntan03/EasySdxlWebUi: Animagine や Pony を Stable Diffusion web UI と forge で簡単に使えるようにします。

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert