shunkeenのブックマーク - はてなブックマーク

【Bedrock×Lambda】高精度なハイブリッド検索RAGをサーバレスで実装（Slack連携も可） - Qiita

はじめに近年、大規模言語モデル（LLM）の発展により、LLMを活用する機会が増加しています。その中でも、LLMを組み込んだ仕組みの一つとして、RAG（Retrieval-Augmented Generation）が注目を集めています。本記事では、はじめに、検索精度を向上させたRAGアーキテクチャを紹介します。次に、それをAWS上で実装する方法について紹介します。本記事で紹介したアーキテクチャの実装に用いるソースコードはGitHubで公開しています。検索精度を向上させたRAGアーキテクチャ RAGの概要と検索手法 RAGの用途としては、社内文書など非公開ドキュメントを読み込ませ、そこから回答できる社内専用AIチャットボットなどが考えられます。そのため、RAGの精度向上のためには、ナレッジベースから検索する際に必要なドキュメントを的確に取得できるかが重要な要素の一つとなります

shunkeen 2024/04/25

“提案するRAGアーキテクチャ”の図、全文検索で20件に絞った後にFAISSでIndexingするのはなぜだろうか。20件程度なら文章IDと埋込ベクトルのルックアップテーブルを用意しておいて、自前でcos類似度計算してもよい気がする

リンク

OpenAI Japanスタート　3倍速い日本語特化モデルも公開へ

shunkeen 2024/04/16

ブコメのアテンションと日本語の相性が悪そうって話は他で聞いたことがないし、帰納バイアスが少ないと言われるTransformerであれば、スケーリング則で、どうとでもなりそうな気はするが、どうなんじゃろうか。

リンク

今のチームに来てから最も生産性が上がった考え方｜牛尾　剛

多分今回のポストは多くの人には参考にならないだろう。相当ニッチなので。でもこれは自分にとってはとても大きなことだったので、忘れないように記録しておきます。生産性の悩み　あまりこの世界では生産性とはあいまいな言葉で、何をもって生産性が高いとは言いにくい。速いのが良いのではない。ただ、自分の実感として自分は生産性が良くないといつも感じていた。だからいろいろ努力したり、考え方をできる人を観察して真似してみたり、直接本人に聞いたりして工夫をしてきた。実は自分はめっちゃコーディングが早い人になりたいわけではない。そうではなくて、「平均的」になりたいだけだ。それぐらいいければ「Strategy」でカバーできるどころかもっと上に行けると確信があったから。でもそうではなくて明らかに遅いのでそれが自分の足を引っ張っていた努力の方向性　様々な努力をして、特に有効だったことを自分の本に書いたつもりではある

shunkeen 2024/04/16

この手の主張を読むと、投機的実行とパイプラインハザードって単語を連想したりする。投機に失敗すればハザードが起きて、そこまでの作業は徒労に終わる。しかし、成功率が高いなら投機したほうが平均的には良い。

リンク

⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について

Zero Waste, Radical Magic, and Italian Graft – Quarkus Efficiency Secrets

shunkeen 2024/04/09

本筋と全然関係ないんだけど、Text Embeddingをやってくれるモデルの図を台形で描く時、台形の下底側からtextが入ってきて、上底側からvectorが出てきて欲しい気持ちがある。

リンク

Azure OpenAI Service を活用した対話型 UI を「じゃらんnet」に試験実装、従来型検索ではわからなかったユーザーニーズが短期間で把握可能に

Microsoft customer stories See how Microsoft tools help companies run their business.

shunkeen 2024/03/27

リンク

ビジネスロジックを「型」で表現するOOPのための関数型DDD / Functional And Type-Safe DDD for OOP

Object-Oriented Conference 2024で発表した資料です。 https://fortee.jp/oocon-2024/proposal/b31c9818-3cb8-4350-adfe-cbc839cdf829 ビジネスの専門知識（ドメイン）を中心に据えたドメイン駆動設計に代数的データ型などの関数型のパラダイムを加えたよりタイプセーフな関数型DDDを紹介します。本セッションではドメインモデリングによって発見したモデルやビジネスロジックをソフトウェアに反映する際により型を重視した設計を加えます。型で表現する範囲が広がることでビジネスロジックをより明確にコードで表現できるようになります。さらには型で表現されているためコンパイルフェーズで気付けるミスが増え、ソフトウェアの品質向上にもつながります。関数型の考えをいれるといってもただ単にHaskellなどに代表される関

shunkeen 2024/03/24

どうでもいい重箱の隅の話だけど、集合の直和の形式的な定義に違和感。ベクトル空間の直和か何かと混同してるのかな？「A⊕B=A∪BただしA∩B={0}」と書いてあるけど、集合の直和なら「ただしA∩B= {}」だよね？？

リンク

速報：話題の 1ビットLLMとは何か？｜寺田英雄（㈱オープンストリームCTO）

2024-02-27にarXiv公開され，昨日（2024-02-28）あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「１ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c

shunkeen 2024/03/02

“BNNの説明が理解できていれば、1.58ビットトランスフォーマーモデルを理解するのは簡単”／やっぱり前提知識がある人は理解の深さが違うんだなぁ。

AI
文章

リンク

既存日本語LLMをBitNetで置き換えて実行してみた｜はち

はじめに昨夜からBit Netという1bit量子化LLMが話題になっていました。簡単な概要としては、既存のLLMが１パラメータをFP16やBF16などのfloat型で扱っているものを、１パラメータで{-1, 0, 1}しか扱わない様にした。計算に使う情報量を削ることで、処理速度の向上、メモリの節約が叶う。 3B params以上ではベンチマークスコアの平均で同サイズのLlamaを上回る結果となった。（量子化手法としては初）ということだと思います。これは元々、今回の論文と同チームによって提案された"Bit Net: Scaling 1-bit Transf ormers for Large Language Models"という論文を拡張したものです。この時は１パラメータで{-1, 1}として扱ってけれど、{-1, 0, 1}としたらうまくいったというのが今回の"The Era of 1

shunkeen 2024/03/02

1(.58)ビット量子化するのを前提に学習時にStraight-Through EstimatorとかRoundClipうんたらを使って学習しないと、量子化して推論したときに結果が振るわない的な話なのかな。手法の一部だけ取り入れても壊れるだけみたいな。

AI
文章

リンク

TypeScriptの代数的部分型模型

本書ではTypeScriptの型と部分型関係がなす代数的構造を解説し、型についての強固かつ柔軟なメンタルモデルを構築します。順序理論、集合論、束論、環論、そして圏論に至るまで、複数の数学理論を利用して多角的にモデルを構築することで、型の直感的な理解を深め、型の互換性に対する自然な推論を可能となるように解説した新しい試みの本です。

shunkeen 2024/02/27

数学的構造をメンタルモデルに使うのが良き。何が証明できるか（応用志向）よりも、いかに脳に楽をさせて推論できるか（理解志向）を意識していそうで素晴らしい。楽をするために数理的解釈を選び取ればいい。

リンク

東京都独自のデジタル地域通貨、QRコードでポイントを貯めて使える「Tokyo Tokyo Point」

shunkeen 2024/01/30

“Tokyo Tokyo Point（仮称）”／Tokyo Pointだと略した時にTポイントだからTokyoを二重にしたのかな。名称を公募したら東京特許許可局ポイント（Tokyo Tokkyo Kyokakyoku Point）とか出てきそう。

リンク

「言葉による解決、あきらめたくない」芥川賞の九段理江さん会見

「東京都同情塔」（新潮１２月号）で芥川賞に決まった九段理江さん（３３）は１７日夜、東京都内で記者会見し、受賞の感慨を語った。主な質疑応答は次の通り。－－最初に一言「小説は好きで一人で書き始めましたが、書き続けることは一人では難しいものですから、書き続ける力をくださる出版社や家族、友人、楽しみに読んでくださる方に、本当にありがとうございますとお伝えしたいです。とにかくうれしい、感謝を伝えたいという気持ちでおります」－－吉田修一選考委員の講評で「完成度が非常に高い」「エンタメ性が高い」と言われたが、どう思うか「完成度が高いという評価をいただけるとは、謙遜ではなく夢にも思っていませんでした。『東京都同情塔』という作品はアンビルト（未建築）をモチーフにした作品なんですけど、アンビルトにもしかしたらなってしまうのではないかと恐る恐る、不安な思いで書いていました。完成してからは自分なりに納得で

shunkeen 2024/01/18

もしもの話として、AIを使った小説執筆のノウハウを詰め込んだ指南書を受賞作家が出したとしたら、本の帯に踊る煽り文には何て書かれるのかな。

リンク

「プロダクトマネージャーがプロダクトマネジメントを失敗させる!?」大企業病の罠を乗り越え若々しいチームを実現する/Traps of Optimization in Product Management 2024

「プロダクトマネージャーがプロダクトマネジメントを失敗させる!?」カオスなプロダクト開発を効率化したら硬くて息苦しい官僚組織になっちゃった! 大企業病の罠を乗り越え若々しいチームを実現するぞ効率化を進めていったら息苦しい組織になってきたと悩む方に向けたセッションです。概要 https://confengine.com/conferences/regional-scrum-gathering-tokyo-2024/proposal/19268 発表者 https://twitter.com/_N_A_ https://note.com/mryy 関連スライド「私考える人、あなた作業する人」を越えて、プロダクトマネジメントがあたりまえになるチームを明日から実現していく方法 https://speakerdeck.com/moriyuya/product-management-rsgt20

shunkeen 2024/01/14

会社の立ち上げ、確立、拡大、衰退の流れと、じゃあどうすればいいのか、を地に足つけて語ってるからなのか、ページ数がものすごいことになっている。

リンク

品質保証部門の陳腐化。そして陳腐化した品質保証は品質を悪化させる - 千里霧中

※品質保証のエンジニアである筆者が自省・戒めのために書いた記事になります品質管理（Quality Control）、品質マネジメントは国内では製造業を中心に発展し、プロダクトの競争力向上に貢献してきました。 JTCと呼ばれる旧来からのメーカーでは、その実績・年功の蓄積に応じて、独立性を保った品質管理・品質保証部門が権威を獲得し、今でもソフトウェア開発に強い影響力を保持するようになっています。筆者は複数のメーカーを転職やコンサルで巡って来ましたが、例えば品質保証部門が承認しないとマイルストーンで開発がブロックされる、プロダクトがリリースできないといった権限を持つ体制が、今なお普遍的に見受けられます。この品質保証部門が権力を持ち、品質ゲートの門番として振る舞う体制は、今であっても、ある面で恩恵を提供しています。例えば次のようなものです：法規制対応、標準化対応、その他公的なガバナンス要求へ

shunkeen 2024/01/12

目的を見失えば、どの時代、どの業務でも起こり得そう。何を目的とした品質なのかを見失って形骸化し、形骸化を格式高さと勘違いする中で、ただの権限が権力に落ちぶれる様は物悲しいが、しかし、ありふれている。

リンク

「避難所をなんだと思ってる」賞味期限切れ食品にシェフ怒り　一方的に置いていかれた支援物資…“民間物資”の受け入れ一時中止に｜FNNプライムオンライン

「避難所をなんだと思ってる」賞味期限切れ食品にシェフ怒り　一方的に置いていかれた支援物資…“民間物資”の受け入れ一時中止に七尾市の避難所で500食以上を炊き出し石川・七尾市の避難所にできた段ボールの山。小学校の玄関を埋め尽くしている。避難所となっている小学校の玄関を埋め尽くす段ボール（石川・七尾市）この記事の画像（30枚）これらはすべて支援物資。中には古着とみられる大量の洋服や、賞味期限が2019年8月で切れたドリンクもあった。中には古着とみられる大量の洋服もこの現状に怒りの声を上げる人物がいる。石川・金沢市でレストランを経営する川本紀男シェフによるSNS投稿「この大半が使えないゴミ、避難所なんだと思ってる　昨日の事、長野ナンバーのトラックが来てトラック1杯分　半分以上のゴミを置いて帰った　ドリンクは全て賞味期限切れ　なんて野郎だ」こうSNSに投稿したのは、石川・金沢市

shunkeen 2024/01/11

マーケティングにおけるプロダクトアウトとマーケットインみたいな話だなぁ。いや、在庫管理と処分を押し付けているなら、プロダクトアウトよりなお悪いか。

リンク

新規事業立ち上げのアンチパターン｜福島良典 | LayerX

新規事業立ち上げのアンチパターンについて考えてみる。このアンチパターンは、完全な飛地の新規事業だけではなく、複数プロダクトを経営する中での隣接領域の新規プロダクトの立ち上げのときや、あるセグメントにPMFした状態から次のPMFを探すときも同様のアンチパターンが適用されうる。ここでのアンチパターンは、1つ目の事業立ち上げ・プロダクト立ち上げで起こることはない。2つ目の事業や2つ目のプロダクトを立ち上げる際に留意する点であり、コンパウンドスタートアップを正しく経営するには必ず頭に入れておきたい内容である。規模からの逆算と顧客インサイトの軽視新規事業における市場選択のアンチパターンである。例えば、売上の30%成長を続けるための、計画と現実のギャップを埋めるために新規事業を規模から探してしまうみたいなケースで見られる。大前提として、市場規模の推定は重要である。実際に事業をやっていると、い

shunkeen 2024/01/11

“規模からの逆算と顧客インサイトの軽視”、“兼務による集中力の阻害と経営の無関心による社内孤立”、“新規事業と既存事業を同じKPIで評価”／毒づくのではなく、綺麗にアンチパターンとして言語化できるのすごい

リンク

なぜセキュリティを言い訳にアジリティが犠牲になるのか - 流沙河鎮

ここ数年、アジリティとセキュリティ(あるいはガバナンス)の両立について考える機会が多い。伝統的で規模の大きい企業にありがちな傾向として、セキュリティやガバナンスを確保するためにはシステムの開発/運用が鈍重、高コスト、不自由になったとしても已む無しとする思想がしばしば見受けられる。結果として例えば簡単な仮想サーバ１つを用意するだけでも数ヶ月の納期と膨大な工数を要するとか、世の中で当たり前に活用されている技術やプロセスが許可されない/導入に非現実的な手続きを要求されるといった状況が生まれる。確かにシステムの安全性を適切にコントロールすることは重要である一方で、論理的に考えれば「セキュリティのためのビジネス」ではなく「ビジネスのためのセキュリティ」なのだから、セキュリティを確保するためにビジネスの成功が妨げられてしまっては本末転倒に思える。しかし実際には「セキュリティのためなので仕方がない」と

shunkeen 2024/01/10

"セキュリティ担当者個人の能力や人格の問題ではなく、組織的な構造的問題がいくつも根底にあり、複雑に絡み合っている。言い換えるなら、経営が責任を問われるべき問題"／セキュリティこん棒 vs 経営者目線こん棒

リンク

OpenAI、開発したオリジナル「GPTs」を公開できる「GPT Store」開店へ

関連記事オリジナルのChatGPTが作れる「GPTs」、全課金ユーザーに開放　プログラミング不要、対話でOK 米OpenAIは、同社のテックカンファレンス「OpenAI DevDay」で発表した、ノーコードでオリジナルの「ChatGPT」が作成できるカスタムツール「GPTs」を全てのサブスクリプションユーザーに開放した。ノーコードで「ChatGPT」のカスタム版を作れる「GPTs」、有料会員に提供へ OpenAIは、初の開発者会議DevDayで、ノーコードでChatGPTのカスタム版を作れる「GPTs」を発表した。作ったGPTsは「GPT Store」で販売し、収益を得ることもできるようになる。 ChatGPTユーザーは毎週1億人　著作権侵害防止の「Copyright Shield」追加 OpenAIはサンフランシスコで開催の初の開発者会議「DevDay」で、「ChatoGPT」のユー

shunkeen 2024/01/05

“GPT Storeで有料アプリを販売し、収益化できるようになるのかどうかはまだ不明だ。”／もしできたとして、どのくらいの人が売買するのかなぁ？

AI

リンク

ヒトだからこそ価値を出せる余地は、AIやデータサイエンスの「外側」の本質への関わり方にある - 渋谷駅前で働くデータサイエンティストのブログ

恒例の年末振り返り記事ですが、もうタイトルが示す通りです。例年通りであれば淡々と1年間の業界動向や個人的な学び、はたまたちょっとした私事などを綴るのですが、今年はたまたま良いお題がやってきたのでまず最初にその話を書こうと思います。生成AIの爆発的な普及と、それに伴って生じた課題 AIやデータサイエンスの「外側」の本質にアプローチするのが、ヒトのなすべき仕事最後に、改めて年末の振り返りを生成AIの爆発的な普及と、それに伴って生じた課題今年は多くの生成AIプロダクトが公開され普及し、それに伴い文字通り正真正銘空前の生成AIブームが到来し、個人や企業のみならず霞ヶ関までもが、そしてついには政府与党までもがこぞって「生成AIの活用」を模索して立ち回るという有様になりました。書店に行けば生成AI関連書籍が棚一面を埋め尽くすという大盛況で、毎日のようにどこそこの大企業が生成AIを導入した〇〇サ