タグ

ブックマーク / techblog.insightedge.jp (3)

  • Chain-of-Thoughtを使ったText-to-Cypher - Insight Edge Tech Blog

    はじめに はじめまして、InsightEdge 分析チームの中野です。 今回は自然言語からCypherクエリを生成する手法について、LLM(大規模言語モデル)を用いたアプローチを紹介します。 最近、RAG(Retrieval-Augmented Generation)という手法が注目されています。これは、LLMが外部の知識ベースを検索し、その情報を基に回答を生成するプロセスです。また、外部知識にナレッジグラフを利用することでデータを構造化し、より関連性の高い情報を抽出することも注目されています。 ナレッジグラフを使用するにはneo4jのようなグラフデータベースを使用することが一般的です。 しかし、このRAGプロセスではテキストからグラフクエリ言語であるCypherクエリを生成する必要があります。 この記事では、このRAGプロセスでCypherクエリを生成する際の課題と、Chain-of-T

    sh19910711
    sh19910711 2024/04/23
    "text-to-cypher: 自然言語からCypherクエリを生成 / 質問文ではクエリの構成を具体的に指定しないため、必ずしも適切なクエリを生成できない / クエリの精度はJaro-Winkler距離 + 応答結果の精度はJaccard係数で測定"
  • Kedroを使って感じたこと - Insight Edge Tech Blog

    こんにちは。12月からInsight Edgeに参画したData Scientistのカイオと申します。 入社してから早速、ChatGPT案件やデータサイエンス案件をいくつか担当しています。 今回は、とある案件で使用したMLパイプライン管理ツール「Kedro」について紹介したいと思います。 目次 Kedroとは なぜKedroを選んだか メリット デメリット 他のツールとの違い まとめ Kedroとは まず、Kedroとは何かの説明から始めましょう。 パイプラインを表示する機能もあります(引用元:https://docs.kedro.org/en/0.17.7/03_tutorial/05_visualise_pipeline.html) Kedroとは、データサイエンスのパイプラインを管理するツールです。データ収集、変換やモデル学習、ハイパーパラメータ調整の管理から精度評価までまとめて簡

    Kedroを使って感じたこと - Insight Edge Tech Blog
    sh19910711
    sh19910711 2024/04/15
    "Kedro: 中間成果物が自動で保存される(個人的にこれが一番大きい) + パイプラインの一部だけ実行できる + プロトタイピングには向いていない / 可視化やmetrics測定はそこまで得意ではありません"
  • KDD 2022 の論文とチュートリアルの紹介 - Insight Edge Tech Blog

    こんにちは!データサイエンティストの伊達です。 今回は、データマイニング分野におけるトップカンファレンスの一つである KDD 2022 で気になった論文とチュートリアルを紹介します。 KDD とは 論文 (Research Track): Wu et al., Non-stationary A/B Tests 背景 論文内容 チュートリアル:Counterfactual Evaluation and Learning for Interactive Systems チュートリアル:New Frontiers of Scientific Text Mining: Tasks, Data, and Tools まとめ KDD とは KDD 2022 (28th ACM SIGKDD International Conference on Knowledge Discovery and Data

    KDD 2022 の論文とチュートリアルの紹介 - Insight Edge Tech Blog
    sh19910711
    sh19910711 2022/12/28
    "KDD 2022: アメリカのワシントンD.C.で現地開催 + 3年ぶりのオフライン開催 / 科学文書に対するテキストマイニングの基礎、固有表現抽出や関係抽出等の技術 / New Frontiers of Scientific Text Mining: Tasks, Data, and Tools"
  • 1