[B! graph] sh19910711のブックマーク

グラフデータの分析と DSOC の取り組みを俯瞰する / Overview of graph data analysis and DSOC initiatives

sh19910711 2024/05/09

"GNN: skipgramの作り方、何を再構成するか、どの空間で畳み込むのかなどで個性 / スポーツのレーティングを転用した企業・業界ごとの特性の把握 + 企業がどの程度競合しているか + 転職ネットワークの埋め込みを活用" 2020

リンク

ElasticsearchとNeo4jをKafkaで連携する - Qiita

どうしてこの記事を書いたのか Elasticsearch/Neo4j 活用していらっしゃいますでしょうか？どちらも著名なデータベース（DB）ですが，その特徴・用途は異なります． Elasticsearch は文字情報の検索に強く，Neo4j は関連性を早く調べたいという場合に利用されているイメージです．所感ですが，Neo4j でもデータのプロパティを基準にクエリをかけたいこともありますし，Elasticsearch に入っているデータ同士を紐づけたいことも往々にしてあります．しかし，愚直にそうしてしまうとスループットが低くなったり，実装に継続的な作りこみが必要だったり，なかなか考え物です．そこで，データ構造を見直しつつ何とか良いとこ取りできないかなと検討するようになりました． Neo4j と Elasticsearch の連携を行うことで， Elasticsearchに投入したデー

sh19910711 2024/05/09

"Neo4j でもデータのプロパティを基準にクエリをかけたい + Elasticsearch に入っているデータ同士を紐づけたい / Neo4j Connector は Sink と Source のどちらもサポート" 2022

リンク

Google+で実感したコミュニケーションの非対称性 - きしだのHatena

Google+は片思いの関係が手軽に可能ということで、非対称ネットワークだといわれる。ただ、片思いが可能というのはTwitterもそうなっている。Google+のほうが片思いが気になりにくいとはいうものの。それよりも、Google+にある非対称として、困ったものがあることに気づいた。それは、サークルのそこに流れるストリームの関係だ。まずひとつとして、こちらがあちらを入れてるのと同じ種類のサークルに、あちらはこちらを入れてないという問題があげられる。たとえば、ぼくが尊敬する技術者がいるとして、その人を「技術」サークルに入れる。そして、ある日、その技術者の人にお会いすることができるわけだが、その場はビールのイベントだったとする。そこでビールの話題でもりあがり後日、向こうは「ビール」サークルにぼくを入れてくれたとする。その尊敬する技術者は、マニアックすぎる技術的な話は、その人の「技術者

sh19910711 2024/05/05

"どのサークルも、サークルのテーマにあった共有が少しと、あとは食べ物と一発ネタの動画とイヌネコの画像、話題のニュースだらけになっていく / なにを共有するか試行錯誤した結果そうなってる" 2011

リンク

QiitaのGNNタグ付けレコメンドにテキスト情報を追加してみる - Qiita

前身となった記事 2つを掛け合わせたような記事です．タグ同士のリンク情報に加えて，記事内容をベクトル化したものを加えることで，さらに良い推論結果が出せるのではないかということで実践してみることにしました．Heterogeneous Graphをカスタムデータに使ってみたいという方におすすめです．以下の流れで実装を進めていきます．データセットの用意テキストデータをベクトル化グラフデータを用意する学習評価実装のnotebookはgithubに挙げてますので，記載していない細かい部分が気になる方はそちらを参照してください．(あまり精査してませんが) https://github.com/taguch1s/qiita-tag-recommend/tree/main いろいろ細かい部分はスルーしてとりあえず実装までこぎつけた感じなので，気になる部分がありましたらご教授いただけますと幸

sh19910711 2024/05/01

"タグ同士のリンク情報に加えて，記事内容をベクトル化したものを加える / 内容とタイトルのテキストデータを結合してdoc2vecで学習 / タグのテキストデータをグラフで利用できる形に変換 + pytorch-geometricのtutorial を参考"

リンク

グラフニューラルネットワーク(GNN; Graph Neural Network)入門 - あつまれ統計の森

前提知識 Transf ormerとグラフニューラルネットワーク下記で詳しく取り扱いました。当記事は下記の副読的な内容になるように取りまとめました。「Transf ormer＝グラフニューラルネットワーク＋ネットワーク分析」と大まかに解釈できるので、当記事ではグラフニューラルネットワークについて詳しく取り扱います。集合と要素グラフ理論では基本的に数ⅠAの「集合」で取り扱われる内容を元に立式されます。当項では「集合」の基本的な式表記の確認を行います。たとえばサイコロの出目の$1$〜$6$の集合を$X$とおくとき$X$は下記のように定義できます。 $$ \large \begin{align} X = \{ 1, 2, 3, 4, 5, 6 \} \end{align} $$ このとき$X$の要素を$x$とおくと、$x \in X$のように表すことができます。$x \in X$は$x$が$

sh19910711 2024/04/28

"Transformerを理解するにあたってはGNNを理解しておくことで直感的な理解が可能 / GNNの数式表記に関しては様々なものがありますが、MPNN(Message Passing Neural Network)の定義を元に考えると理解しやすい" 2023

リンク

GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ - 機械学習とかコンピュータビジョンとか

はじめに GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ．Generative flowを使ってmolecular graphを生成する初めての試みとのこと． GraphNVP Generative Flowの一般的な話は何度か記事にしているのでここでは割愛．今回は，molecular graphをgenerative flowを使って生成するのが目的．ここではグラフの生成を，ノードの隣接関係の記述とノードの表現（ラベル）の二つに分けて考える．定義として，グラフをとし，をそれぞれ，adjacency tensorとfeature matrixとする．ただし，隣接関係の種類を，ノードのラベルの種類をとした．グラフが与えられた時にとなるようなモデルを作る．今回はモデルとしてGenerati

sh19910711 2024/04/26

"GraphNVP: molecular graphをgenerative flowを使って生成 + グラフGは離散的に表現 + 上で議論したモデルは連続な分布 + ギャップを埋めるためuniform noiseを加える (dequantization) " arXiv:1905.11600 2019

リンク

『グラフニューラルネットワーク』を上梓しました - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

グラフニューラルネットワーク (機械学習プロフェッショナルシリーズ) 作者:佐藤竜馬講談社Amazon 講談社より『グラフニューラルネットワーク（機械学習プロフェッショナルシリーズ）』を上梓しました。グラフニューラルネットワークはグラフデータのためのニューラルネットワークです。化合物やソーシャルネットワークのようなグラフデータの解析に使うことができます。また後で述べるように、テキストも画像もグラフなのでテキストや画像の分析にも使えますし、それらを組み合わせたマルチモーダルなデータにも適用できます。要は何にでも使うことができます。この汎用性がグラフニューラルネットワークの大きな強みです。本稿ではグラフニューラルネットワークを学ぶモチベーションと、本書でこだわったポイントをご紹介します。グラフニューラルネットワークは何にでも使える付加情報をグラフとして表現できるグラフニューラルネッ

sh19910711 2024/04/26

"転導学習 (transductive learning) の訳にはこだわり / 既知の具体的事例を「転」じて、未知の具体的事例を「導」く / 既存の日本語の文献ではトランスダクティブ学習と訳 + トランスダクティブの意味を初見で取るのは不可能"

リンク

PAKDD2023報告 - Qiita

はじめに 2023年5月25日(木)から5月28日(日)にかけてPAKDD2023が大阪で開催されました。PAKDDは、データマイニングを主とした国際会議です。この記事では、個人的に注目した発表についてポイントを整理し、読んでいただいた方に雰囲気を掴んでいただくことを目指します。 PAKDD2023 https://pakdd2023.org/ プログラム https://pakdd2023.org/program/ 会議の様子（同僚執筆のQiita記事）国際会議PAKDD2023に聴講参加してきましたチュートリアル Moving Beyond Traditional Anomaly Detection 要約：2022年くらいまでの異常検知技術を整理したチュートリアルポイント： Shallowモデル(kNN、LOF、ヒストグラムベース、PCA、iForest)とDeepモデル（AE、

sh19910711 2024/04/24

"PAKDD: データマイニングを主とした国際会議 / Wang: グラフで情報を効率的に捉えるために、情報の構造を階層的、周期的などと分類 + 適切な潜在空間(超球やユークリッド空間)を与えることで、性能を向上" 2023

リンク

Hadoop Conference Japan 2011 Fallに行ってきた - seikoudoku2000のブログ

Hadoop Conference Japan 2011 Fallに行ってきた。 eventbrite http://hadoop-conference-japan-2011-fall.eventbrite.com/ リクルートのMIT作成のQAやら講演資料のサイト (現状、一部の資料がアップされているのみ。) http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html 午前中のセッションに関しては、ITProのニュースになってたり、他のブログでも書かれていたり、技術的にはこれといった話が無かったりだったので略。午後はずっとCommyunity Trackのセッションを聞いていたので、そのまとめ。 Elastic MapReduce: Amazon Web Serviceが提供するhadoopサービス　　@sh

sh19910711 2024/04/24

"Pregelにインスパイアされたプロジェクトたち: Hama + GoldenOrb + Giraph / webは元々Graphだしということで、IT業界はどこを見てもGraphに到達する / LSH: 効率はいいが、精度に問題がある + 関数が肝 + likelikeではMinHashを利用" 2011

リンク

PyTorch Geometricのデータセットの自作するための簡単なまとめ - Qiita

PyGはグラフの機械学習に有用だが、データセットの自作が最初は難しかったので最低限必要な知識を記しておく。 InMemoryDataset CPUメモリに収まるデータセットを構成できる便利なクラス。概観最初にインスタンスを生成すると、processメソッドが呼び出されてデータセットが処理される。 torch.save()でデータがdata.ptに保存され、次回以降高速に読み込める。最低限知っておけばよいメソッド raw_file_names 処理前の生のデータのファイルがあればここに書いておく。 processed_file_names 処理されたデータが、__init__で渡したディレクトリの下にこのファイル名で保存される。 process グラフのノード, エッジ, 重み, 特徴量の設定などを行う。基本的にtorch_geometric.data.Dataクラスでグラフを表現し、

sh19910711 2024/04/24

"PyG: グラフの機械学習に有用 + データセットの自作が最初は難しかった / InMemoryDataset: CPUメモリに収まるデータセットを構成 / インスタンスを生成すると、processメソッドが呼び出されてデータセットが処理" 2023

リンク

Chain-of-Thoughtを使ったText-to-Cypher - Insight Edge Tech Blog

はじめにはじめまして、InsightEdge 分析チームの中野です。今回は自然言語からCypherクエリを生成する手法について、LLM（大規模言語モデル）を用いたアプローチを紹介します。最近、RAG（Retrieval-Augmented Generation）という手法が注目されています。これは、LLMが外部の知識ベースを検索し、その情報を基に回答を生成するプロセスです。また、外部知識にナレッジグラフを利用することでデータを構造化し、より関連性の高い情報を抽出することも注目されています。ナレッジグラフを使用するにはneo4jのようなグラフデータベースを使用することが一般的です。しかし、このRAGプロセスではテキストからグラフクエリ言語であるCypherクエリを生成する必要があります。この記事では、このRAGプロセスでCypherクエリを生成する際の課題と、Chain-of-T

sh19910711 2024/04/23

"text-to-cypher: 自然言語からCypherクエリを生成 / 質問文ではクエリの構成を具体的に指定しないため、必ずしも適切なクエリを生成できない / クエリの精度はJaro-Winkler距離 + 応答結果の精度はJaccard係数で測定"

リンク

確率モデルを使ったグラフクラスタリング

[DL輪読会]Understanding Black-box Predictions via Influence Functions Deep Learning JP

sh19910711 2024/04/23

"ネットワーク構造を知りたいからクラスタリングを行うのにネットワーク構造を仮定するのは矛盾 / 確率モデル: リンクの生成モデルを考え、モデル学習を通じてクラスタリング + クラスタの構造は仮定しない" 2013

リンク

【論文紹介】E(n) Equivariant Graph Neural Networks - Pseudo Theory of Everything

対称性が課された機械学習の理論に興味があり、なんとなく探していたところ、最近出た論文に読みやすそうなものがあったので読んでみました。次の論文を紹介したいと思います。 arxiv.org イントロダクションこの論文では、グラフニューラルネットワーク(GNN)に $E(n)$ 変換のもとで同変(equivariant)性を課したモデルを構築しています。 $E(n)$ は $n$ 次元ユークリッド空間での等長変換群であり、回転、並進、鏡映、置換からなりますが、今回の論文では基本的に回転と並進に着目しているように思えます。このような変換を考えることのモチベーションとしてはData Augmentationなどがあるようで、著者たちの過去の関連論文では arxiv.org などがあります。後に紹介しますが、グラフニューラルネットワークに対称性を課した研究は、点群(point cloud

sh19910711 2024/04/22

"n次元ユークリッド空間での等長変換群 + モチベーションとしてはData Augmentationなど / 従来のグラフニューラルネットワークで使われるノードの特徴ベクトルhの他に実際のノードの座標であるxを導入" arXiv:2102.09844 2021

リンク

Rによるネットワークデータのプロット

sh19910711 2024/04/22

"statnet: ネットワーク分析やプロットに使うパッケージが一通り入ってる / igraph: （statnetほどじゃないけど）基本的な関数はそろっている / Ggraphでも同じようなことができる" 2021

リンク

論文解説: P-Companion: A Principled Framework for Diversified Complementary Product Recommendation - Qiita

論文解説: P-Companion: A Principled Framework for Diversified Complementary Product RecommendationMachineLearningDNNRecommendation論文読みGNN はじめに P-Companion: A Principled Framework for Diversified Complementary Product Recommendation というAmazonがCIKM2020に投稿した論文について解説します。論文を選んだ動機 E-Commerceサイトの推薦では、ユーザーが見ている商品詳細ページに対して、以下2種類の商品を推薦することが多いです。 substitute: 現在見ている商品と代替関係にある商品 complementary: 現在見ている商品と合わせて買われるよう

sh19910711 2024/04/21

"「co-purchase(一緒に買われる商品)が、常に補完商品になる」という仮定が成り立たないことを示し / Product2Vec: GNNで商品情報から商品ベクトルを作成 + ログの少ない商品に対する推薦も可能に" doi:10.1145/3340531.3412732

リンク

【論文紹介】 Node2Vecでネットワークのベクトル埋め込みを学習する。 - Qiita

卒論のためにNode2Vecの論文を読んだので、この手法でネットワークの構造を学習する方法について解説します。数式を追わなくてもある程度理解できるようになっていると思います。参考元元論文: node2vec: Scala ble Feature Learning for Networks PyTorch GeometricのNode2Vecモデル: torch_geometric.nn.models.Node2Vec 再現実装の際にPyTorch Geometric(PyG)のモデルを用いたので、論文に明記されていない学習方法などはこちらを参考にしました。 Node2Vecとは Node2Vecは、ランダムウォークによってグラフの特徴が乗った系列を生成する生成したウォークの系列をWord2VecのSkip-Gramモデルの入力とし、目的関数を最適化するという手順でグラフの分散表現を

sh19910711 2024/04/20

"参考元 PyTorch GeometricのNode2Vecモデル / Node2Vec: 半教師あり学習によって計算速度と精度を両立 / Negative Samplingの論文やNCE(Noise Contrastive Estimation)などについて調べてみると良い" 2023

リンク

【KDD2020 Workshop採択論文紹介】GCNで時系列予測！？ - Qiita

明示的にグラフ構造でないデータに対してもGraph Convolution Network(GCN)が使える！？ドコモの久保田です。この記事では、データマイニングの国際会議であるKDD2020で開催されたThe Second International Workshop on Deep Learning on Graphs: Methods and Applications (DLG-KDD’20)に採択された私たちの論文"Time-aware GCN: Representation Learning for Mobile App Usage Time-series Data"を紹介します。論文はKDDのリンクのページからダウンロードできます。 KDD2020の投稿傾向 KDD2020のOpening1でResearch Trackのトピックごとの投稿論文数が報告されていましたが、上位2

sh19910711 2024/04/18

"Time-aware GCN: 時系列データをグラフデータとして捉える / アプリ間の利用時間間隔がΔt_thであれば、アプリ間にエッジを張る / 良い表現を獲得できたかを、次のアプリを予測するタスクとして定義" KDD2020

リンク

GraphDBの「Dgraph」の話 - Goで叩く

こんにちは。もう、Webの開発を何年もやってきたのになと思うのに、まだまだ理解できてなかったことがあるんだなぁと日々痛感させられてるmasamikiです。 GraphDB こないだ GoのORM「ent」の話を書かせてもらったのですが、GraphQLを使う仕事も結構でてきたなと。さてさて、同じGraphの名を冠するGraphDBとはなんでしょうか。 Graph自体はentでMySQLに対して表現していたように、DBによらず、そのデータ構造のモデルを作ることは難しくありません。この記事の言葉をかりると Graph DBとは、index-freeな隣接する頂点を取得できるストレージシステムなら、それをGraphDBと呼べるそうです。もうちょっと細かい定義としては、（といっても翻訳してるだけですが）すべての要素（つまり、頂点またはエッジ）には、隣接する要素への直接のポインタがある。

sh19910711 2024/04/18

"Dgraph: GraphQL（っぽいクエリ）を使えるむっちゃ速いGraphDB / Neo4jでGraphQLを使うためには、Extensionが必要だったり / SlashGraphQL: Dgraphを搭載したフルマネージドGraphQLバックエンドサービス" 2020

リンク

【論文読み】画像をグラフ構造として特徴抽出するVisionGNN - Qiita

以下の論文の内容をまとめた。 Vision GNN: An Image is Worth Graph of Nodes 2022/06 https://arxiv.org/abs/2206.00272 Kai Han, Yunhe Wang, Jianyuan Guo, Yehui Tang, Enhua Wu パッチ化した画像でグラフを構築し、グラフニューラルネットワークで特徴抽出、画像分類や物体検出タスクに利用する。Transf ormerやMLPを使った画像処理の研究とコンセプトは似ている。まとめ前提/課題 CNN, transf ormer, MLP, 等を利用してコンピュータビジョンモデルが改善されている画像中の物体は通常、形状が不規則で四角形ではないため、ResNetやViTなどの従来のネットワークで一般的に使われているグリッドやシーケンス構造は、冗長で柔軟性がなく、処理しに

sh19910711 2024/04/17

"VisionGNN: 画像をノードと見なせるいくつかのパッチに分割し、近傍のパッチを連結してグラフを構成 + GNNで特徴抽出、画像分類や物体検出 / 深層部では中心ノードの近傍はより意味的" arXiv:2206.00272 2022

リンク

Graph U-Nets

sh19910711 2024/04/15

"セグメンテーションで定番のU-Netをグラフでも適用できるようにしたい / Graph U-Net: CNNのpooling/unpoolingをグラフ上で定義 + GCNと組み合わせ / U-Net: downsamplingの途中の各階層で特徴マップをupsampling側に渡す" arXiv:1905.05178 2019

リンク

はてなブックマーク

タグ

関連タグで絞り込む (66)

graphに関するsh19910711のブックマーク (223)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス