タグ

ihirokyxのブックマーク (215)

  • SaaSを作るという仕事について

    Open standards for building event-driven applications in the cloud

    SaaSを作るという仕事について
    ihirokyx
    ihirokyx 2024/05/22
    継続的、普遍にとりくむ
  • ベクトルデータの容量を96%削減するBinary Embedding

    導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムの中では、どんな情報にアクセスするかを決定する際に、Embeddingと呼ばれる文章をベクトル化する技術が使用されています。そして多くの場合では小数(float)の多次元ベクトルが採用されています。 しかし、Embeddingの中には各ベクトルの数値を1Bitのデータとして扱うBinary Embeddingというものが存在します。 記事では、Embeddingの手法の一つであるそのBinary Embeddingについて解説と検証を行います。 サマリー Binary Embeddingを採用することで以下のような効果を得ることができます。 保管するベクトルデータの容量を96%ほど削減で

    ベクトルデータの容量を96%削減するBinary Embedding
    ihirokyx
    ihirokyx 2024/05/22
    “Binary Embedding”
  • AWS Observability Best Practices

    Home Home Guides Data types Tools Curated recipes FAQ Contributors オブザーバビリティとは¶ 概要¶ オブザーバビリティとは、観測対象のシステムからのシグナルに基づいて、継続的にアクション可能な洞察を生成および発見する機能です。つまり、オブザーバビリティを使用すると、システムの状態を外部出力から理解し、(修正)アクションを実行できます。 対処する問題¶ コンピュータシステムは、CPU 時間、メモリ、ディスク領域などの低レベルのシグナルや、API 応答時間、エラー、トランザクション毎秒などの高レベルかつビジネス上のシグナルを観測することで測定されます。 システムの可観測性は、その運用と開発コストに大きな影響を与えます。観測可能なシステムは、操作者に意味のある実行可能なデータを提供し、(インシデント応答の高速化、開発者生産性の向

  • DuckDBでお手軽!データフェデレーション - Techtouch Developers Blog

    tl;dr はじめに DuckDB とは DuckDB では何が読めるのか 使ってみる S3 上のJSON を読んでみる リレーショナルデータベース 他ツールではなく DuckDB を使うメリット しくじりポイント (特にリリースされたばかりの)バージョンには気をつける S3 のオブジェクト数が多い場合不都合がありがち スレッドの調整が必要な場合も Redshift には未対応 終わりに 付録 MySQL のデータを読み込む例の MySQL 側の準備 tl;dr DuckDB 便利だよ。分析以外でも使えるよ 色々な場所のデータを閲覧・結合できるよ。標準SQLも使えるよ ただし、細かい落とし穴は色々あるので気をつけてね はじめに2023年4月にデータエンジニアとして入社したmin(@not_rogue)です。暖かくなるにつれ、YouTube で見た南伊豆ロングトレイル | 松崎町に行く機運が

    DuckDBでお手軽!データフェデレーション - Techtouch Developers Blog
    ihirokyx
    ihirokyx 2024/05/20
    readerとしてつかうduckdb
  • Reader API

    Our world-class embeddings for search, RAG, agent systems.

    Reader API
    ihirokyx
    ihirokyx 2024/05/17
    “LLM-friendly input from a URL or a web search”
  • 成長の為にアウトプットがなぜ必要なのか。mattn氏が語る持続的なアウトプットのススメ

    成長の為にアウトプットがなぜ必要なのか。mattn氏が語る持続的なアウトプットのススメ 2024年5月16日 mattn 大学卒業後、ソフトウェアハウスやSIerなどでソフトウェア開発に携わる。vi派生のテキストエディタVimの日語化やプラグイン、Go言語などでOSS(オープンソースソフトウェア)の開発・コミュニティ運営に参加し、2019年からGoogle Developers Expert。2021〜2023GitHub Stars。著書に『みんなのGo言語』(2016年、2019年に改訂2版、技術評論社、共著)、『Go 言語プログラミングエッセンス』(2023年、技術評論社、単著)がある。関西在住。 X:@mattn_jp GitHub

    成長の為にアウトプットがなぜ必要なのか。mattn氏が語る持続的なアウトプットのススメ
    ihirokyx
    ihirokyx 2024/05/17
    情報収集源と気にするジャンル、気軽に思いつきで 別に新しくなくて良い
  • 「博士課程に行ってみたい」という社会人の方への長い手紙。|今井悠資

    そろそろ博士課程の振り返りをしようと思って、これを機にnoteを書いてみることにしました。最初の記事としては相応しいのではないかと思って。 ※記事は2023年6月に書いたものです。文中にAIを使うことについての記述がありますが、LLMの進歩は目覚ましいものがありますので、お読みになっている時点の状況に応じて読み替えていただければと思います。なお、私はAIは適切な用法を理解して使う上では非常に有用だと考えています。 おかげさまで2023年3月に博士号を頂くことができました。謝辞にも書いたのですが、当に多くの方にお世話になってここまで来ることができました。お名前を上げだすとそれだけで稿が埋まってしまうので畏れ多くも割愛させていただきますが、改めて感謝申し上げたいと思います。 さて、何年も社会人博士を名乗ってきたせいで「私も博士課程に興味があるのですが」と相談をいただくことがたびたびありま

    「博士課程に行ってみたい」という社会人の方への長い手紙。|今井悠資
    ihirokyx
    ihirokyx 2024/05/17
    “研究が楽しいと思えるか”
  • AIラジオ『zenncast』の技術構成(プロンプトつき)

    先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。 ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。 このZennではzenncastの技術構成や仕組みを紹介します(プロンプトつき)。 作ったもの まずはエピソードを一つ選んで1分くらい聴いてみてください! AIラジオの雰囲気が掴めると思います。 主な機能・特徴 毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介 お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地 これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify

    AIラジオ『zenncast』の技術構成(プロンプトつき)
  • 欠陥を早期に発見するための Software Engineer in Test とその重要性 / What is Software Engineer in Test and How they works

    IT 開発変革セミナー 2024 春 ~Spring~ ~効率化、コスト削減にとどまらない、システム開発の在るべき姿~ 基調講演2 https://members09.live.itmedia.co.jp/library/Njc3Nzc%253D

    欠陥を早期に発見するための Software Engineer in Test とその重要性 / What is Software Engineer in Test and How they works
    ihirokyx
    ihirokyx 2024/05/16
    テスト容易設計
  • MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]

    株式会社ラクーンホールディングスのエンジニア/デザイナーから技術情報をはじめ、世の中のためになることや社内のことなどを発信してます。 bashパフォーマンスMySQLInnoDBDB設計インデックス こんにちは、羽山です。 今回は MySQL のプライマリキーに UUID を採用する場合に起きるパフォーマンスの問題を仕組みから解説します。 MySQL(InnoDB) & UUID のパフォーマンスについては各所でさんざん議論・検証されていますが、論理的に解説した記事が少なかったり一部には誤解を招くようなものもあるため、しっかりと理由から理解するための情報として役立つことができればと思っています。 UUID と比較される古き良き昇順/降順のプライマリキーはというと、 MySQL の InnoDB において良いパフォーマンスを出すために縁の下の力持ちのような働きをしてくれているケースが実は少な

    MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]
  • DORA | Research

    DORA’s Research Program DORA is the longest running academically rigorous research investigation of its kind. Our research team applies behavioral science methodology to uncover the predictive pathways which connect ways of working, via software delivery performance, to organizational goals and individual well-being. Explore our findings using the interactive diagram below: click any item to learn

  • 電子情報学特論: Chromium のアーキテクチャを解き明かす 〜 EEIC の授業が生きるプロダクトの世界〜

    電子情報学特論: Chromium のアーキテクチャを解き明かす 〜 EEIC の授業が生きるプロダクトの世界〜 Kentaro Hara 2024 May (๑>ᴗ<๑) * * * *

    電子情報学特論: Chromium のアーキテクチャを解き明かす 〜 EEIC の授業が生きるプロダクトの世界〜
  • 組織の一体感を生み出すためのリリース内容共有会とは? - Techtouch Developers Blog

    こんにちは、プロダクトマネージャーの yujiro です。 最近 Nintendo Switch を購入し、と一緒にスーパーマリオをプレイしてます。数少ない共通の話題が増えて嬉しいです。 はじめに 前提:テックタッチはハイタッチCSに支えられている 「 Showcase 」とは 事前準備 開催当日 得られる効果 さいごに はじめに テックタッチではおよそ3ヶ月に1度の間隔で新機能をリリースしており、その際にリリース内容共有会を開催してリリース内容の社内周知を行っています。このリリース内容共有会を社内では「 Showcase 」と呼んでいます。 この「 Showcase 」は、リリース内容の説明に留まらないプロダクトチームとビジネスチームをつなげるユニークなイベントになっています。記事では、「 Showcase 」を通じてどのように両者の距離を縮め、一体感のあるカルチャーを生み出している

    組織の一体感を生み出すためのリリース内容共有会とは? - Techtouch Developers Blog
    ihirokyx
    ihirokyx 2024/05/13
    - ビジネスチームへの機能・ユースケースの周知、プロダクトチームのモチベーション向上、リリースノート化
  • 本家Examplesで知る、新たなニューラルネットワーク『KAN』の威力 - Qiita

    文中の図は理がない限り、原論文あるいはドキュメントからの引用です。 KANってなに? KAN(Kolmogorov-Arnold Network) は2024年4月30日にプレプリント公開サイトarXivに投稿された論文 にて提案された従来のMLPとは異なる新たなニューラルネットワーク構造です。1 コルモゴロフ・アーノルド表現定理(Kolmogorov-Arnold representation theorem)に基づいて設計されており、非線形な活性化関数そのものを直接学習することから、パラメータ効率が良く、学習結果の解釈可能性が高いことが特徴です。 上の画像は$x, y$を入力として$\exp(\sin(\pi x)+y^2)$を正解として学習させるケースを示した図ですが、元の関数の関係性がそのまま活性化関数の形状として学習され現れていることが読み取れます。 コルモゴロフ・アーノルド表現

    本家Examplesで知る、新たなニューラルネットワーク『KAN』の威力 - Qiita
  • C++erは全員戻り値型の後置記法を使おう - ペイントソフト開発日誌

    目次 目次 「戻り値型の後置記法」って何? 何が嬉しいの? 問題点 「戻り値型の後置記法」って何? C++11から導入された言語仕様です。 タイトルの呼び方は自分が勝手に使っているだけで、英語圏だと「trailing-return-type」がよく使われるらしい。 cpprefjp.github.io この仕様を使うと例えば以下のようなコードが int Add(int a, int b) { return a + b; } このようになります。 auto Add(int a, int b) -> int { return a + b; } 何が嬉しいの? この仕様はC++のメタプログラミングで戻り値型の推論を簡単に行う目的で使用されます。 なんだ、そんなC++上級者のための機能なんて下々の人間には関係ないじゃん、とお思いかもしれませんが、この機能にはもう一つわかりやすい大きなメリットがある

    C++erは全員戻り値型の後置記法を使おう - ペイントソフト開発日誌
    ihirokyx
    ihirokyx 2024/05/10
  • 日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました — Stability AI Japan

    ポイント Japanese Stable LM 2 1.6B(JSLM2 1.6B)は16億パラメータで学習した日語の小型言語モデルです。 JSLM2 1.6Bのモデルサイズを16億パラメータという少量にすることによって、利用するために必要なハードウェアを小規模に抑えることが可能であり、より多くの開発者が生成AIのエコシステムに参加できるようにします。 ベースモデルとしてJapanese Stable LM 2 Base 1.6Bと、指示応答学習(Instruction tuning)済みのJapanese Stable LM 2 Instruct 1.6Bを提供します。両モデルともStability AI メンバーシップで商用利用が可能です。また、どちらのモデルもHugging Faceからダウンロードすることができます。 Japanese Stable LM 2 Base 1.6B

    日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました — Stability AI Japan
    ihirokyx
    ihirokyx 2024/05/10
  • 個人的におすすめしたいFeature-Sliced Designというフロントエンドアーキテクチャ設計方法論

    Feature-Sliced Designというフロントエンドアーキテクチャ設計方法論をプロジェクトに導入してみたところ、 個人的には良いと感じているので、どのような設計方法論なのか、具体的にどのような部分が良いと感じたかを紹介していきたいと思います。 Feature-Sliced Designとは? Feature-Sliced Designは、フロントエンドアプリケーションを対象としたアーキテクチャ設計方法論です。公式サイトでは、「コードを整理するためのルールと規約の集大成」と記載されています。 Feature-Sliced Designの設計方法論 Feature-Sliced Designでは、プロジェクトはLayerで構成され、各LayerはSliceで構成され、各SliceはSegmentで構成されます。 Layer Feature-Sliced Designの第一階層をLay

    個人的におすすめしたいFeature-Sliced Designというフロントエンドアーキテクチャ設計方法論
  • DORA Core Model

    ケイパビリティを基に予測されるのがパフォーマンスで、パフォーマンスを基に予測されるのが成果(組織パフォーマンス)です。 ザックリとそう書かれていますが、つまりはそれぞれ相関する値を軸にして結果を観測していきましょうというお話になります。 柔軟なインフラ クラウドコンピューティングを導入し、以下の5つの重大特性を満たしている組織が柔軟なインフラを備えているとされる。 オンデマンドのセルフサービス:人間の介入なしでコンピューティングリソースをプロビジョニングできる 幅広いネットワークアクセス:携帯電話、タブレット、ラップトップ、ワークステーションなどのさまざまなプラットフォームを介して機能にアクセスできる リソース・プーリング:プロバイダーリソースはマルチテナントモデルでプールされ、物理リソースと仮想リソースがオンデマンドで動的に割り当てられ、国・州・データセンターなどのより高い抽象レベルで場

    ihirokyx
    ihirokyx 2024/05/08
    “DORA Core Model”
  • プロダクトの機能・データについて理解を深める「輪テーブル会」の紹介 - Techtouch Developers Blog

    はじめまして、テックタッチで DataEnabling チームのエンジニアマネージャーをしているtaker です。 DataEnabling チームでは、社内の様々な組織のデータ活用をより推進し、プロダクト開発やカスタマサクセスを強化するためデータ基盤の改善や社内からの様々な依頼について日々取り組んでいます。 この記事ではそんな私達のチームが、チーム内でデータに関する知識を共有するプラクティスについて共有させていただくため、一筆したためました。 はじめに 取組内容について 進める上で気をつけている点 実施した結果良かったこと 終わりに はじめに データ活用を進める上では、プロダクトのデータ構造や機能とデータの対応関係について精通している必要があります。 例えば、カスタマーサクセス(CS)から「 xx の機能を有効にしている顧客数を知りたい」という問い合わせがあった際「 xx の機能」が「ど

    プロダクトの機能・データについて理解を深める「輪テーブル会」の紹介 - Techtouch Developers Blog
    ihirokyx
    ihirokyx 2024/05/07
    “データに関する知識を共有する”
  • nginxのlocationの優先順位を誤解していた - NullPointer's

    最近nginxを触っていて、locationの優先順位、主に^~の有無による前方一致の扱いについて誤解していたことに気づいた。 まず正解から。locationは以下の流れで決定される 完全一致チェック -> location = path {} locationとURIが完全一致すれば、この設定で確定 前方一致チェック -> location path {} または location ^~ path {} ^~ の有無や記述の順番は優先度に影響しない。最長一致するものが選ばれる ^~ ありのlocationが選ばれた場合、この設定で確定 ^~ なしのlocationが選ばれた場合、保留して正規表現チェックに移る 正規表現チェック -> location ~* regexp または location ~ regexp {} 設定ファイルに記述された順番でマッチングしていく マッチするものがあ

    nginxのlocationの優先順位を誤解していた - NullPointer's