どうしてこの記事を書いたのか Elasticsearch/Neo4j 活用していらっしゃいますでしょうか? どちらも著名なデータベース(DB)ですが,その特徴・用途は異なります. Elasticsearch は文字情報の検索に強く,Neo4j は関連性を早く調べたいという場合に利用されているイメージです. 所感ですが,Neo4j でもデータのプロパティを基準にクエリをかけたいこともありますし,Elasticsearch に入っているデータ同士を紐づけたいことも往々にしてあります. しかし,愚直にそうしてしまうとスループットが低くなったり,実装に継続的な作りこみが必要だったり,なかなか考え物です. そこで,データ構造を見直しつつ何とか良いとこ取りできないかなと検討するようになりました. Neo4j と Elasticsearch の連携を行うことで, Elasticsearchに投入したデー
Google+は片思いの関係が手軽に可能ということで、非対称ネットワークだといわれる。 ただ、片思いが可能というのはTwitterもそうなっている。Google+のほうが片思いが気になりにくいとはいうものの。 それよりも、Google+にある非対称として、困ったものがあることに気づいた。それは、サークルのそこに流れるストリームの関係だ。 まずひとつとして、こちらがあちらを入れてるのと同じ種類のサークルに、あちらはこちらを入れてないという問題があげられる。 たとえば、ぼくが尊敬する技術者がいるとして、その人を「技術」サークルに入れる。そして、ある日、その技術者の人にお会いすることができるわけだが、その場はビールのイベントだったとする。そこでビールの話題でもりあがり後日、向こうは「ビール」サークルにぼくを入れてくれたとする。 その尊敬する技術者は、マニアックすぎる技術的な話は、その人の「技術者
前身となった記事 2つを掛け合わせたような記事です. タグ同士のリンク情報に加えて,記事内容をベクトル化したものを加えることで,さらに良い推論結果が出せるのではないかということで実践してみることにしました.Heterogeneous Graphをカスタムデータに使ってみたいという方におすすめです. 以下の流れで実装を進めていきます. データセットの用意 テキストデータをベクトル化 グラフデータを用意する 学習 評価 実装のnotebookはgithubに挙げてますので,記載していない細かい部分が気になる方はそちらを参照してください.(あまり精査してませんが) https://github.com/taguch1s/qiita-tag-recommend/tree/main いろいろ細かい部分はスルーしてとりあえず実装までこぎつけた感じなので,気になる部分がありましたらご教授いただけますと幸
前提知識 Transformerとグラフニューラルネットワーク 下記で詳しく取り扱いました。当記事は下記の副読的な内容になるように取りまとめました。 「Transformer=グラフニューラルネットワーク+ネットワーク分析」と大まかに解釈できるので、当記事ではグラフニューラルネットワークについて詳しく取り扱います。 集合と要素 グラフ理論では基本的に数ⅠAの「集合」で取り扱われる内容を元に立式されます。当項では「集合」の基本的な式表記の確認を行います。たとえばサイコロの出目の$1$〜$6$の集合を$X$とおくとき$X$は下記のように定義できます。 $$ \large \begin{align} X = \{ 1, 2, 3, 4, 5, 6 \} \end{align} $$ このとき$X$の要素を$x$とおくと、$x \in X$のように表すことができます。$x \in X$は$x$が$
はじめに GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ.Generative flowを使ってmolecular graphを生成する初めての試みとのこと. GraphNVP Generative Flowの一般的な話は何度か記事にしているのでここでは割愛. 今回は,molecular graphをgenerative flowを使って生成するのが目的.ここではグラフの生成を,ノードの隣接関係の記述とノードの表現(ラベル)の二つに分けて考える. 定義として,グラフをとし,をそれぞれ,adjacency tensorとfeature matrixとする.ただし,隣接関係の種類を,ノードのラベルの種類をとした.グラフが与えられた時にとなるようなモデルを作る.今回はモデルとしてGenerati
グラフニューラルネットワーク (機械学習プロフェッショナルシリーズ) 作者:佐藤 竜馬講談社Amazon 講談社より『グラフニューラルネットワーク(機械学習プロフェッショナルシリーズ)』を上梓しました。 グラフニューラルネットワークはグラフデータのためのニューラルネットワークです。化合物やソーシャルネットワークのようなグラフデータの解析に使うことができます。また後で述べるように、テキストも画像もグラフなのでテキストや画像の分析にも使えますし、それらを組み合わせたマルチモーダルなデータにも適用できます。要は何にでも使うことができます。この汎用性がグラフニューラルネットワークの大きな強みです。 本稿ではグラフニューラルネットワークを学ぶモチベーションと、本書でこだわったポイントをご紹介します。 グラフニューラルネットワークは何にでも使える 付加情報をグラフとして表現できる グラフニューラルネッ
はじめに 2023年5月25日(木)から5月28日(日)にかけてPAKDD2023が大阪で開催されました。PAKDDは、データマイニングを主とした国際会議です。この記事では、個人的に注目した発表についてポイントを整理し、読んでいただいた方に雰囲気を掴んでいただくことを目指します。 PAKDD2023 https://pakdd2023.org/ プログラム https://pakdd2023.org/program/ 会議の様子(同僚執筆のQiita記事) 国際会議PAKDD2023に聴講参加してきました チュートリアル Moving Beyond Traditional Anomaly Detection 要約:2022年くらいまでの異常検知技術を整理したチュートリアル ポイント: Shallowモデル(kNN、LOF、ヒストグラムベース、PCA、iForest)とDeepモデル(AE、
Hadoop Conference Japan 2011 Fallに行ってきた。 eventbrite http://hadoop-conference-japan-2011-fall.eventbrite.com/ リクルートのMIT作成のQAやら講演資料のサイト (現状、一部の資料がアップされているのみ。) http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html 午前中のセッションに関しては、ITProのニュースになってたり、他のブログでも書かれていたり、技術的にはこれといった話が無かったりだったので略。 午後はずっとCommyunity Trackのセッションを聞いていたので、そのまとめ。 Elastic MapReduce: Amazon Web Serviceが提供するhadoopサービス @sh
PyGはグラフの機械学習に有用だが、データセットの自作が最初は難しかったので最低限必要な知識を記しておく。 InMemoryDataset CPUメモリに収まるデータセットを構成できる便利なクラス。 概観 最初にインスタンスを生成すると、processメソッドが呼び出されてデータセットが処理される。 torch.save()でデータがdata.ptに保存され、次回以降高速に読み込める。 最低限知っておけばよいメソッド raw_file_names 処理前の生のデータのファイルがあればここに書いておく。 processed_file_names 処理されたデータが、__init__で渡したディレクトリの下にこのファイル名で保存される。 process グラフのノード, エッジ, 重み, 特徴量の設定などを行う。基本的にtorch_geometric.data.Dataクラスでグラフを表現し、
はじめに はじめまして、InsightEdge 分析チームの中野です。 今回は自然言語からCypherクエリを生成する手法について、LLM(大規模言語モデル)を用いたアプローチを紹介します。 最近、RAG(Retrieval-Augmented Generation)という手法が注目されています。これは、LLMが外部の知識ベースを検索し、その情報を基に回答を生成するプロセスです。また、外部知識にナレッジグラフを利用することでデータを構造化し、より関連性の高い情報を抽出することも注目されています。 ナレッジグラフを使用するにはneo4jのようなグラフデータベースを使用することが一般的です。 しかし、このRAGプロセスではテキストからグラフクエリ言語であるCypherクエリを生成する必要があります。 この記事では、このRAGプロセスでCypherクエリを生成する際の課題と、Chain-of-T
[DL輪読会]Understanding Black-box Predictions via Influence Functions Deep Learning JP
対称性が課された機械学習の理論に興味があり、なんとなく探していたところ、最近出た論文に読みやすそうなものがあったので読んでみました。次の論文を紹介したいと思います。 arxiv.org イントロダクション この論文では、グラフニューラルネットワーク(GNN)に \(E(n)\) 変換のもとで同変(equivariant)性を課したモデルを構築しています。 \(E(n)\) は \(n\) 次元ユークリッド空間での等長変換群であり、回転、並進、鏡映、置換からなりますが、今回の論文では基本的に回転と並進に着目しているように思えます。このような変換を考えることのモチベーションとしてはData Augmentationなどがあるようで、著者たちの過去の関連論文では arxiv.org などがあります。後に紹介しますが、グラフニューラルネットワークに対称性を課した研究は、点群(point cloud
論文解説: P-Companion: A Principled Framework for Diversified Complementary Product RecommendationMachineLearningDNNRecommendation論文読みGNN はじめに P-Companion: A Principled Framework for Diversified Complementary Product Recommendation というAmazonがCIKM2020に投稿した論文について解説します。 論文を選んだ動機 E-Commerceサイトの推薦では、ユーザーが見ている商品詳細ページに対して、以下2種類の商品を推薦することが多いです。 substitute: 現在見ている商品と代替関係にある商品 complementary: 現在見ている商品と合わせて買われるよう
卒論のためにNode2Vecの論文を読んだので、この手法でネットワークの構造を学習する方法について解説します。数式を追わなくてもある程度理解できるようになっていると思います。 参考元 元論文: node2vec: Scalable Feature Learning for Networks PyTorch GeometricのNode2Vecモデル: torch_geometric.nn.models.Node2Vec 再現実装の際にPyTorch Geometric(PyG)のモデルを用いたので、論文に明記されていない学習方法などはこちらを参考にしました。 Node2Vecとは Node2Vecは、 ランダムウォークによってグラフの特徴が乗った系列を生成する 生成したウォークの系列をWord2VecのSkip-Gramモデルの入力とし、目的関数を最適化する という手順でグラフの分散表現を
明示的にグラフ構造でないデータに対してもGraph Convolution Network(GCN)が使える!? ドコモの久保田です。この記事では、データマイニングの国際会議であるKDD2020で開催されたThe Second International Workshop on Deep Learning on Graphs: Methods and Applications (DLG-KDD’20)に採択された私たちの論文"Time-aware GCN: Representation Learning for Mobile App Usage Time-series Data"を紹介します。論文はKDDのリンクのページからダウンロードできます。 KDD2020の投稿傾向 KDD2020のOpening1でResearch Trackのトピックごとの投稿論文数が報告されていましたが、上位2
こんにちは。 もう、Webの開発を何年もやってきたのになと思うのに、まだまだ理解できてなかったことがあるんだなぁと日々痛感させられてるmasamikiです。 GraphDB こないだ GoのORM「ent」の話 を書かせてもらったのですが、GraphQLを使う仕事も結構でてきたなと。 さてさて、同じGraphの名を冠するGraphDBとはなんでしょうか。 Graph自体はentでMySQLに対して表現していたように、DBによらず、そのデータ構造のモデルを作ることは難しくありません。 この記事の言葉をかりると Graph DBとは、index-freeな隣接する頂点を取得できるストレージシステムなら、それをGraphDBと呼べるそうです。 もうちょっと細かい定義としては、(といっても翻訳してるだけですが) すべての要素(つまり、頂点またはエッジ)には、隣接する要素への直接のポインタがある。
以下の論文の内容をまとめた。 Vision GNN: An Image is Worth Graph of Nodes 2022/06 https://arxiv.org/abs/2206.00272 Kai Han, Yunhe Wang, Jianyuan Guo, Yehui Tang, Enhua Wu パッチ化した画像でグラフを構築し、グラフニューラルネットワークで特徴抽出、画像分類や物体検出タスクに利用する。TransformerやMLPを使った画像処理の研究とコンセプトは似ている。 まとめ 前提/課題 CNN, transformer, MLP, 等を利用してコンピュータビジョンモデルが改善されている 画像中の物体は通常、形状が不規則で四角形ではないため、ResNetやViTなどの従来のネットワークで一般的に使われているグリッドやシーケンス構造は、冗長で柔軟性がなく、処理しに
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く