タグ

*dataとpatternに関するsh19910711のブックマーク (9)

  • LLMの事前評価のシステムアーキテクチャを紹介します

    この記事の概要 こんにちは。PharmaX でエンジニアをしている諸岡(@hakoten)です。 この記事では、「YOJO事業部のプロダクト内で使用されているLLM(Large Language Models)の機能の性能を事前評価するための仕組み」について、システムのアーキテクチャをご紹介しています。 LLMを用いて実現している具体的な機能については詳しく触れていませんので、その点ご理解ください。 LLMにおける事前評価とは何か まず、プロダクトにおけるLLM(Large Language Models)機能の評価がどのようなものかについて簡単に説明します。 LLMの特徴の一つとして、「出力が確率的である(毎回異なる)」という点があります。そのため、LLMで生成された文章や出力に対しては、出力結果の良し悪しを定量的に計測する方法が必要になります。 弊社における定量的な計測は、大きく次の2

    LLMの事前評価のシステムアーキテクチャを紹介します
    sh19910711
    sh19910711 2024/05/09
    "LLMで生成された文章や出力に対しては、出力結果の良し悪しを定量的に計測する方法が必要 / CSVにはPromptLayerのrequest_idとバージョンをスコアとセット + Cloud Storageに保存 + Data Transfer Serviceを用いて、定期的にBigQueryに同期"
  • Data Vault モデリングのご紹介 - Safie Engineers' Blog!

    データ分析基盤グループでデータエンジニアをしている平川です。 近年注目されてきているDataVaultに関して、全3回(予定)で記事を書かせていただく予定です。 第1回の記事では、DataVaultとは何なのか?どんな特徴があるのかを書いていきます。 参考までに、1~3回の内容を紹介しておきます。(内容は変わる可能性が大いにありますのでお許しください🙇‍♂️) 第1回: DataVaultってなに?どんな特徴があるの? ← 今回はここ 第2回: dbtvaultを使って実際にDataVaultモデリングでテーブルを作ってみた 第3回: BusinessVaultの使い所や特徴的なSatelliteの利用におけるハマったところや良いところ これまでのデータモデリング手法 3NF ディメンショナルモデリング DataVaultとは何か? Hub Link Satellite モデリングにおけ

    Data Vault モデリングのご紹介 - Safie Engineers' Blog!
    sh19910711
    sh19910711 2023/03/05
    "DataVaultの優れている点: 過去の指定の時点のデータの状態を保持することが可能 + 変更に対する柔軟性の高さ + 短い開発サイクル / 課題点: クエリがJOINだらけになる + 「正しく」Hubを設計することが簡単ではない"
  • デイヴィッド・スピヴァックはデータベース界の革命児か -- 関手的データモデル - 檜山正幸のキマイラ飼育記 (はてなBlog)

    最近、「おおおー、これは凄い、すんばらしい!」と思ったことがあるので、それについて書きます。 最初に言葉についてのお断り; "categorical"の訳語をどうしようか? と。片仮名で「カテゴリカル」が無難ですが、漢字で書きたい。「圏論的」が落ち着きがいいようですが、必ずしも「論」の意味を含まないときもあります。そこで、以下、「圏的」を使います。 [追記 date="2013-02-12"]入門的解説を書きました。→「衝撃的なデータベース理論・関手的データモデル 入門」[/追記] スピヴァックと関手的データモデル デイヴィッド・スピヴァック(David I. Spivak, http://math.mit.edu/~dspivak/)は、MITの研究者です。 彼は圏的情報学(categorical informatics)を提唱しています*1。圏的情報学の中心的な概念が関手的データモデル

    デイヴィッド・スピヴァックはデータベース界の革命児か -- 関手的データモデル - 檜山正幸のキマイラ飼育記 (はてなBlog)
    sh19910711
    sh19910711 2020/05/10
    "圏論と直接対応する関手的データモデルでは、今まで蓄積された圏論の知識や手法がそのまま全部適用できる"
  • Python: ERAlchemy を使って ER 図を描く - CUBE SUGAR CONTAINER

    今回は ERAlchemy という ER 図を描くツールを使ってみる。 このツールは erd という Haskell で書かれた同様のツールにインスパイアされて作られたものらしい。 ただ、機能的にできることは ERAlchemy の方が多いみたいだ。 ERAlchemy が提供する基的な機能は次の通り。 ER フォーマットのテキストファイルから ER 図を生成する SQLAlchemy 経由で既存のデータベースから ER 図を生成する 後者の既存データベースから ER 図を生成するところなんかは、これまでだと MySQL Workbench を使ったりしてた。 ただ、このやり方だと文字通り MySQL でしか使えないのに対して ERAlchemy はそれ以外のデータベースにも対応している。 今回も試しに SQLite3 のデータベースから ER 図を生成してみている。 ただ、この機能が出

  • (旧版)DDD × CQRS 更新系と参照系で異なるORMを併用して上手くいった話

    (旧版)DDD × CQRS 更新系と参照系で異なるORMを併用して上手くいった話1. DDD x CQRS - 更新系と参照系で異なるORMを併用して上手くいった話 2017/09/19 株式会社ビズリーチ 松岡 幸一郎 2. 発表者紹介 ● 松岡 幸一郎 3. 主にサーバーサイド 4. フロントは最近入門 5. プロジェクト経歴 銀行システム4年 若手向け転職サイト 2年 社内システム半年 6. 主な技術 Excel Java 7. Excelはもういい 8. 主な技術トピック Excel Java 9. 開発楽しい! 主な技術トピック Excel Java 10. しかし待ち受ける技術的負債との戦い 11. 主な技術トピック Excel Java SAStruts jQuery Java 12. 万全の対策 13. 主な技術トピック Excel Java SAStruts jQuer

    (旧版)DDD × CQRS 更新系と参照系で異なるORMを併用して上手くいった話
  • 30分間データモデリング 〜ER図を描こう!〜(1/4) ― @IT

    30分間データモデリング ~ER図を描こう!~:データベースエンジニアへの道(2)(1/4 ページ) 連載は、ITシステム開発の現場でプログラミングやSQLのコーディングを行っているエンジニア(データベース利用者)が、データ管理者(DA)やデータベース管理者(DBA)へステップアップするための第一歩として有効な基礎知識を紹介する(編集局)

    30分間データモデリング 〜ER図を描こう!〜(1/4) ― @IT
  • 最新DBアーキテクチャについて(と思われる会話

    nyaxt @nyaxt pvldbの論文読んでるとMySQLが常に評価でぼこぼこにされてて面白い。よくあるのが、MySQL、商用DBMS、著者のDBMS、著者DBMS+新規手法でそれぞれ2x-10xずつちがう 2013-01-13 23:42:39

    最新DBアーキテクチャについて(と思われる会話
  • バッチ処理を再考する - 急がば回れ、選ぶなら近道

    最近そもそもバッチ処理というものを知らない人達を見ることが多くなりました。某プロジェクトで「いや、ストプロってよくわからないんですよ。最近書いたことないし。」という話をずーっと聞いていたのですが、人はバッチ処理という意味で話していたことが後から判明した、ということがありました。 ああ、この人はSQLでのバッチ処理しか知らないのですね、とちょっと衝撃ではありました。とうとうそーゆー時代になったかと。 まず、誤解のないようにいうとバッチ処理、という言葉自体はIT固有のものではないです。生産管理や物流や、そういった業務では普通に「バッチ」という言葉をIT以外で使います。ただし意味はある程度同じで、「一定の塊を一度に処理をする」ということです。物流システムの業務要件なんかを詰めているとバッチっていうと、どっちのこと?なんて普通に聞かれたりします。その意味ではバッチの対義語がリアルタイムというのは

    バッチ処理を再考する - 急がば回れ、選ぶなら近道
  • 【データベース設計】 テーブル名、カラム名の名前の付け方(命名規則) at softelメモ

    データベース設計のテーブル名、カラム名の物理名について、とても個人的な自分ルールをご紹介。 テーブル名は、 小文字英数字とアンダースコアだけ使う。大文字は避ける。 一般的な英単語、ローマ字(ヘボン式)でつける。多少長くなってもいい。 頭に何かつける(t_***、m_***、c_***など)。 カラム名は、 小文字英数字とアンダースコアだけ使う。大文字は避ける。 一般的な英単語、ローマ字(ヘボン式)でつける。 頭にテーブル名を付ける。ものすごく長くなってもいい。 大文字小文字はDBMS、OS、プログラミング言語によって区別されたりされなかったりするので、無用なトラブルを避けるため。 ヘボン式で統一すれば、ツはtuなのかtsuなのか、シはsiなのかshiなのかで迷わなくなる。 テーブル名に t_***、m_***、c_*** などを付けて、テーブル、マスタ、多対多の関連を表すテーブル、ログ的な

    【データベース設計】 テーブル名、カラム名の名前の付け方(命名規則) at softelメモ
  • 1