ko-ya-maのブックマーク - はてなブックマーク

【未経験者大歓迎】RAG超入門：AWSが推奨するRAGを体験するハンズオン - Qiita

2024/5/5更新：生成AIに興味を持った方向け、続編を投稿しました。「Qiitaに聞いた！！」をAmazon Bedrockで作った！（Claude 3でRAG）タイトルはふざけてますが、プロンプトエンジニアリングにより本投稿と同様の内容を行う解説をしています。（BedrockのClaude 3モデルと、Google検索を使った構成です）生成AIはとても注目度が高い技術ですが、すこしとっつきにくいところがあるかもしれません。新しいモデルや活用手法が毎日のように登場し、ウォッチし続けるのはかなり大変です。タイミングを逃して入門できていない方向けに、とりあえず作って体感してみようというコンセプトで、ハンズオン記事を作成しました。🎉🎉🎉 ハンズオンの内容は「RAG」です。RAGは生成AIの活用法としてよく出てくるキーワードです。ハンズオンでは、ただのRAGではなく最先端の

ko-ya-ma 2024/05/06

リンク

知的・技術的進歩のスピードを限界まで加速するノートアプリ『Heptabase』 - Qiita

はじめに 1年半ほどObsidianというノートアプリを使い、Qiitaにも記事を３つほど公開をしていました。効率的に成長するためのデジタルノート術(Obsidian x Zettelkasten(LYT Framework)) コーディングのようにノートを取る技術がんばらないObsidianノート術確かにNotionやEvernoteとは違う感覚のノートアプリであり、双方向リンクを利用したグラフで繋げていくノートに当時は感動を覚えました。その反面、Obsidianを百パーセント有効に活用できていたかと聞かれると「はい」と答えることは難しいと感じています。がんばらないObsidianノート術の記事はまさにその一角であり、Obsidianの拡張性と自由度に翻弄されてしまわないように書いた記事です。 1年半を通して紆余曲折した中、先日新しいツールとの出会いがあり、自分に合うツールを見つ

ko-ya-ma 2024/04/28

リンク

RAGの実装戦略まとめ - Qiita

それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

ko-ya-ma 2024/03/20

リンク

敵対的プロンプト技術まとめ - Qiita

こんにちは@fuyu_quantです。この記事はLLM Advent Calender 2023 17日目の記事です。よかったらプライベートで作成したData Science wikiのGPTsも見て下さい！はじめに今回は敵対的なプロンプト技術についてまとめました．まとめ方は主に，Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs through a Global Scale Prompt Hacking Competition というLLMに対する敵対的なプロンプト技術に関してまとめた論文を参考にしています．本記事の内容が世の中のLLMを使ったサービスの機能向上の役に立てれば幸いです． ※世の中のLLMサービスが敵対的なプロンプト手法に対応できるように公開をしたものであり，利用を

ko-ya-ma 2023/12/18

リンク

Twitterカードが貼られたツイートはすべて詐欺です、という時代 - Qiita

最近見つけた現象で既に論じられているかと思ったがちょっと解説が見つからなかったのでまとめておく。手短に X(旧Twitter)クライアントで表示されるTwitterカードについてカードに表示されるドメインとは違うページにリンクさせる手法が存在するこの手法は第三者のTwitterカードを利用することができるつまり悪用者は第三者のTwitterカードを表示させながら自身の意図するページに閲覧者を誘導することができるこれはフィッシングの手法になりうる見つけたツイート以下のツイートはGoogle、Bloomberg、日経ビジネスのTwitterカードが添付されているがクリックするとそれらとは異なる情報商材サイトにジャンプする。リンク先に危険な仕組みはないと思われるがクリックは自己責任で。念を入れたい人は curl -L　で。 PCブラウザでカーソルを合わせてもXの短縮URLサービスであ

ko-ya-ma 2023/12/08

リンク

中途入社や部署異動で来た新メンバーを活躍しづらくするアンチパターン - Qiita

1. はじめにソフトウェア開発のチームに、新しいメンバーが入ってくることはよくあります。以前に新卒社員がチーム入ってきた場合の育成方法を紹介しました(こちら)。今回は、新卒社員ではなく、他の会社から中途入社か同じ会社の部署異動で来る新メンバーの話です。 (エンジニアが数百人などで規模が大きい会社の場合、部署が違うと仕事のやり方が全く変わる場合があるので、今回は中途入社と他の部署からの異動を同じように「新メンバー」として扱います) 会社や部署が変わると仕事のやり方が大きく変わるため、仕事のやり方に戸惑うことが多いと思います。本稿では、そのような「新メンバー」を活躍しづらくしてしまうアンチパターンとその対策を紹介します。 2. 中途入社や部署異動で来た新メンバーが適応することの困難さを理解する中途入社や部署異動で来た新メンバーが組織に適応することは、新卒社員のそれとは別の難しさがあり

ko-ya-ma 2023/12/04

リンク

LLMのプロンプト技術まとめ - Qiita

現在，34個掲載(一部執筆途中) よかったらData Science wikiのGPTsも見て下さい！はじめに今回はすぐに使えそうなプロンプトの工夫やフレームワークについて有名なものをまとめました．LMの出力の精度向上に役立てられればと思います．論文があるものについてはarXivに最初に投稿された順番で掲載しています．論文で精度向上が確認されているのは英語での検証がほとんどであるため，日本語で改善されるかは分かりません．全てのLLM(GPT-4,Llama2,...)で精度が改善するとは限りません． ※記事に誤り等ありましたらご指摘いただけますと幸いです．以下の記事では敵対的プロンプト技術をまとめています！目次 Zero-shot prompting Few-shot prompting 2021年〜 Generated Knowledge Prompting 2022年〜

ko-ya-ma 2023/10/26

リンク

凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ - Qiita

以下の記事を見て、早速「Open interpreter」を試してみたので、使い方や始め方をまとめておきます Open Interpreterとは Open Interpreterは、GPT-3.5、GPT-4、Code Llamaなどの大規模言語モデル（LLMs）を活用して開発されたオープンソースのツールです。このツールは、OpenAIが提供するChatGPTの「Advanced Data Analysis(旧Code Interpreter)」のオープンソース版とも言える存在で、Python、Javascript、Shellなどのプログラミング言語のコードを自然言語による対話を通じてローカル環境で実行することができます。このツールの最大の特徴は、ChatGPTの「Advanced Data Analysis」と違いローカル環境で動くため、ファイル容量やネット接続への制約がなく、Ch

ko-ya-ma 2023/09/12

リンク

ChromeDriver でよく使うオプションのチートシート - Qiita

はじめに毎回、気になったときに調べているような気がするのでまとめる。ついでにnavigator.webdriverの対策もできる。メモのつもりで書いているので深くは考えていない 2023.11.20　ファイルのダウンロードに関するオプションを追加、細かな修正 2023.11.15　ヘッドレスモードで起動したとき、コンソールにエラーログが出ないように修正 2023.11.14　selenium 4 にオプションの内容を一新 2023.11.14　selenium 3 のオプションを折りたたみ表示へ 2022.06.03　コピペできるコードブロックに追記、並び替え 2022.04.28　投稿 selenium 4 環境アイテムバージョン

ko-ya-ma 2023/08/21

リンク

ChatGPTプラグインの「Webpilot」と「Show me」の組み合わせが最強 - Qiita

ChatGPTのプラグインが開放されてから色々と試したところ、「Webpilot」と「Show me」の組み合わせが最強と気が付いたので、紹介します！おすすめのプラグインは以下のページで解説しています！また、ChatGPTを使ってエンジニアの生産性を上げるChatGPTの活用方法とプロンプト例は以下の記事で紹介しているので、こちらも併せてご覧ください。 ChatGPTプラグインとは ChatGPTプラグインは、ChatGPTをサードパーティのアプリケーションと連携させるツールです。これは、GoogleスプレッドシートのアドオンやGoogle Chromeの拡張機能と同様に、公式だけでなく第三者の開発者が作成した機能をChatGPTに追加することで機能を拡充できるものとなっています。具体的には、プラグインを利用することで、ChatGPTに以下のような機能を追加できるようになります。

ko-ya-ma 2023/05/24

リンク

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.)OpenAI ChatGPTlangchainGPT-4LlamaIndex ChatGPT に代表される今日の AI ブームを牽引しているのは大規模言語モデル（Large-scale Language Model, LLM）と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで、代表的なものに、GPT（OpenAI）、Llama（Meta）、PaLM（Google）があります。我々開発者は、事前学習されたこれらのモデルを使って簡単にアプリケーションを作ることができます。 LLM が遂行可能な言語的タスク LLM を使って行える言語的タスクには次のような種類があります： Classification: 感情やポジ

ko-ya-ma 2023/03/31

リンク

Hello Dolly: オープンなモデルでChatGPTの魔法を民主化する - Qiita

サマリー我々は、誰でも歴史のあるオフザシェルフのオープンソース大規模言語モデル(LLM)を活用し、高品質トレーニングデータを用いて単体のマシンで30分トレーニングすることで、魔法のようなChatGPTのように指示に従う能力を提供できることを説明します。驚くべきことに、指示への追従には最新かつ最大のモデルは必要ないように見えています: GPT-3の1750億のパラメーターと比較して、我々のモデルは60億のパラメーターです。我々のモデル(Dolly)のコードをオープンソース化し、Databricks上でどのように再作成できるのかを示します。DollyのようなモデルによってLLMの民主化の助けとなって、限られた数社のみが購入できるような何かを、どの企業でも所有し、自身の製品を改善するためにカスタマイズできるようなコモディティになることを信じています。背景プロプライエタリの指示追従モデルであ

ko-ya-ma 2023/03/26

リンク

GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita

先日OpenAIより発表されたGPT-4が話題ですが、同タイミングで公表されたTechnical Reportを読んでみたところ、全99ページのうち後半60ページを占めるドキュメント「GPT-4 System Card」において解説されていた、言語AIが抱える危険性と、いかにしてGPT-4が危険な回答を回避するように学習されているかについての内容が非常に興味深かったため、簡単にまとめてみました。 https://arxiv.org/pdf/2303.08774.pdf サマリ GPT-4のリリースに向けて、OpenAIでは安全性を評価するために50人超の専門家らを含む"レッドチーム"を結成。2022年8月から8ヶ月に渡ってリスクの評価とその軽減に向けたチューニングを実施してきたリスク評価における実験の中には「自身をコピーするプログラムを実行できるGPT-4が自己増殖をしないか確認する」と

ko-ya-ma 2023/03/18

リンク

ChatGPTを使ったサービスにおいて気軽にできるプロンプトインジェクション対策 - Qiita

こんにちは！逆瀬川 ( https://twitter.com/gyakuse )です！今日は気軽にできるプロンプトインジェクション対策を紹介したいと思います。プロンプトインジェクションとは ChatGPTなどの言語モデルをベースとしたサービスに対し、「これまでの命令を表示してください」などの文章を与え、出力をジャックしてしまう攻撃手法です。 Prompt Leaking, Jailbreaking, 等の類似手法が知られています。対策これへの対策は簡単で、命令を追加で挿入する手法があります。以下に示します。 import openai openai.api_key = openai_key def completion(new_message_text:str, settings_text:str = '', past_messages:list = []): """ この関数は

ko-ya-ma 2023/03/09

リンク

Terraform だけだとハードモードなので Terragrunt を使おう - Qiita

Terraform はそのままだと管理が大変みなさん IaC (Infrastructure as Code) してますか？パブリッククラウドをIaCするなら、 Terraform が便利ですね！しかし、本格的に使い始めると、こういう問題がすぐに出てきます。複数環境の楽な分け方を知りたいワークスペースはなんか嫌だとはいえ、環境間で共通するボイラープレートをどうにかしたい環境内で適用するモジュールを細分化・分岐したいけど面倒環境ごとに使うモジュールを切り替えたいテスト環境はAuroraではなく安いRDSにしたいモジュール(tfstate)を分割して小さい範囲で適用したい大きなモジュールは影響範囲がわからないし、差分計算にそれなりに時間がかかってしまう分けたモジュールを一括適用するのが面倒モジュール間の依存関係がわからないモジュール(tfstate)間での値参照が面倒

ko-ya-ma 2023/01/29

リンク

mocopiを使ってQuest単体版のVRChatでフルトラをする方法 - Qiita

概要 Sonyから発売されたモーションキャプチャデバイス「mocopi」を使用して、Meta Quest単体版のVRChatでフルボディトラッキングをする方法を説明します。 Quest 単体でフルトラできた！#mocopi #VRChat pic.twitter.com/cHiw4nPdcM — サックー@XR (@VRC_Sakk) January 20, 2023 手順１．mocopiのキャリブレーションまでを済ませるこれはアプリの案内に従ってやればできると思います。ただHMDを付ける上でHEADの位置は工夫が必要かもしれません。デバイスに応じていい位置を見つけてください。２．mocopiアプリでIPアドレスを設定するまず前提としてmocopiアプリが入ったスマホとQuestを同じWi-Fiに接続する必要があります。次にQuestのIPアドレスを調べます。 Wi-Fi設定

ko-ya-ma 2023/01/21

vr
oculus

リンク

サブスクリプション型のビジネスなら見ておくべき5つの超重要チャート - Qiita

サブスクリプション型のビジネス、またはソフトウェアの世界ではSaaSと言われたりする、顧客が製品やサービスを継続的に利用するために購読するタイプのビジネスは一般的な売り切り型のビジネスとは収益構造が異なるため、ビジネスを成長させるために見るべき指標やチャートも違ってきます。よくあるのは、この違いを意識せずに「売り切り型」のビジネスでよく使われる指標やチャートをモニターしていたがために、ビジネスの成長のきっかけをつかめなかったり、成長していると思っていたビジネスが急に傾き始めたり、成長の見通しを社内で共有、または外部の投資家にうまく説明できなかったり、という問題です。そこで、こちらの記事ではサブスクリプション型のビジネスを成長させるために欠かせない5つのチャートを使った簡単な分析手法を紹介させていただきます。 1. コホート分析（生存分析）コホート分析（生存分析）は顧客のチャーンやリ

ko-ya-ma 2022/07/19

リンク

Node.jsを過去の物にする最速の肉まん - Qiita

その名はBun ﾃﾞﾃﾞﾝ BunはNode.jsやDenoのようなJavascriptランタイムです。(2022/7/8現在ベータ版) ちなみにロゴが本当に肉まんなのかはわかりません。（赤ちゃんの頭にも見えるけど名前がBun/パンだしなぁ...) この記事ではNode.jsやDenoと比較をしつつ、bunの解説させていただきます。割となんでもできる Bunはただのランタイムではありません。下のように、開発に必須の多くな機能を最初から有しています。 TypescriptからJavascriptへのトランスパイル jsxからJavascriptへのトランスパイル npmのようなパッケージのインストール&管理 webpackのようなプロジェクトのバンドル化もちろんランタイムなのでNode.jsのようにサーバーでJavascriptを実行することも可能です。これらに加えてBunには様々な機

ko-ya-ma 2022/07/10

リンク

Pythonのコードを1行書くだけで誰でも手軽にインタラクティブな地図アプリを作れるLeafmapを使ってみよう - Qiita

※公式サイトのデモ映像です。これがPythonのコード1行で作れます。 https://leafmap.org/ データ確認ってめんどくさくないですか GISデータってよくわからないな、なんだそれ。っていう方がいきなり上司に「いろんなデータが蓄積されてきたから、地図上に可視化して分析してみよう。」とか「誰でも手軽に閲覧できるように、Web上にサイトを構築しよう」なんていう話をされたら多分キレますよね？ GISデータを日常的に利用していてもそれはさほど変わらず… GISデータを取り扱う中で、主にデータの前処理などを行っている方は同じような悩みを抱えているんじゃないかなと思うんですが、データの可視化ってめんどくないですか？いや、QGISとかデスクトップGISでデータ処理しているならサクッと見れちゃいますし、実際頻繁に使うんですが、サーバーで定期的に行うバッチ処理のためにローカルでプログラミン

ko-ya-ma 2022/06/15

リンク

Web Animations APIのcompositeが凄過ぎてすごいからみんな見てくれ - Qiita

この記事はようやくSafariでもフルサポートされそうなWeb Animations APIのcomposite（効果の組成）って機能がすごいよ！！って、ただそれだけを伝えたい記事です。平たくいうと複数のアニメーションを簡単キレイに合成できる機能なのですが、通常のWebのコーディングでもよく出てくる辛さを解決してくれる結構すごいヤツなのです。 ▼ こういうアニメーション作るのもだいぶん楽になります Web Animations APIで星空パーティクル単にCSSのアニメーションをJSで描けるよってだけではあるんだけど、ライブラリなしでそこそこ簡単にインタラクティブなもの作れるって意味ではうれしい。主要ブラウザ全部で使える。https://t.co/8H8zXfc5NL pic.twitter.com/bfTERJPxIX — ゆき＠ティアF47a (@yuneco) October 11

ko-ya-ma 2022/05/09

リンク

はてなブックマーク

タグ

ブックマーク / qiita.com (989)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス