タグ

visualizationと*programに関するsh19910711のブックマーク (148)

  • Poincaré Embeddings でJ1リーグのチーム・選手を可視化 - u++の備忘録

    ふと「Poincaré Embeddings」*1で遊んでみたいと思い立ち、サッカーJ1リーグのデータで試してみました。 Poincaré Embeddings gensimでの実装とデータセット Poincaré Embeddingsの学習 活用方法 おわりに Poincaré Embeddings Poincaré Embeddingsに関する説明は、ABEJA*2やscouty*3のブログに譲ります。 Poincaré Embeddings は端的に言うと word2vec の埋め込み先をユークリッド空間ではなく双曲空間にするという手法で、階層構造やべき分布をもつデータを埋め込むという問題設定において、低次元でもよい表現を与えられるという特徴があります。 Poincaré Embeddings による職種の類似度計算とその利用 - LAPRAS AI LAB gensimでの実装とデ

    Poincaré Embeddings でJ1リーグのチーム・選手を可視化 - u++の備忘録
    sh19910711
    sh19910711 2024/05/11
    "gensimの実装では正則化の影響で周囲にノードが集結しすぎないような工夫 / チーム名が中心 + 円周側に選手 / 「浦和レッズ」の近くに「サンフレッチェ広島」が配置 + 移籍した選手の影響ではないか" 2019
  • LightGBMによる物性予測モデルの計算過程を視覚化する - Qiita

    はじめに LightGBM の中身について理解するためにやってみたメモ 環境 記事では以下を事前にインストールしておく必要がある。 Graphviz Python numpy pandas matplotlib scikit-learn LightGBM RDKit Graphvizについては、ツールをインストールした後、Pythonのライブラリをインストールする必要がある。Python: LightGBM の決定木を可視化して分岐を追ってみる や、【Windows10】Graphvizのインストール等を参考にしてほしい。 モデル構築 まずはRDKitを使ってもモデルを作成してみよう。 まずはモジュールのインポート import numpy as np import pandas as pd from matplotlib import pyplot as plt from sklear

    LightGBMによる物性予測モデルの計算過程を視覚化する - Qiita
    sh19910711
    sh19910711 2024/05/09
    "データフレームのままLightGBMで学習を行うと可視化の際にpandasの列名が特徴名として表示 / plot_treeメソッドにより可視化 + dump_modelというメソッドを使うとjson形式でモデルの情報が得られる" 2022
  • データ分析のためのデータ可視化入門を読んだので感想です。 - niszetの日記

    遅くなりました… www.kspub.co.jp @niszetが人生色々とgdgd進行しているため、読み終えるまでに時間かかってしまいましたが、最後まで読み終えたので読後の感想を書こうと思います。 なお、書は id:u_ribo さんより GitHub Sponsorsのお礼という事で頂きました。ありがとうございました。なんかすみません…。 ちょっと雑多な文章になりますが、ご容赦ください。 感想 読後感としては、文の文章が思ったより多く(付録をあわせて300ページを超えているので相応の分量ということですが)、基は通して読むタイプなのでそれなりに腰を据えて読むのが良いと思いました。洋書にありがち?な、脇道に逸れたような話はないので純粋に説明の文章量が多いということでしょうから、悪い意味ではないです。 5章がデータの整形の話で、その前までが比較的基的な可視化の話、6章がモデルデータ、

    データ分析のためのデータ可視化入門を読んだので感想です。 - niszetの日記
    sh19910711
    sh19910711 2024/05/06
    "良い可視化とそれをggplotでやるにはどうするのが良いのか?を一冊で学べる / 単純にggplotの文法を知りたいという目的なら「Rグラフィックスクックブック 第2版」がある" 2021
  • Extending ggplot2(和訳) - Qiita

    この記事は、Rのggplot2パッケージの「Extending ggplot2」というVignetteを訳したものです。原文はGPL-2ライセンスで公開されているggplot2パッケージに含まれ、著作権はHadley Wickhamに帰属します。この翻訳文にもGPL-2ライセンスが適用されます。 Note that the original document is provided under the license of GPL-2 and the copyright belongs to Hadley Wickham, one of the authors of ggplot2. このvignetteには、ggplot2 2.0.0で公式に提供される拡張メカニズムについて書きます。 このvignetteは、?Statや?Geomや?themeで読むことができる低レベルな詳細をまとめたも

    Extending ggplot2(和訳) - Qiita
    sh19910711
    sh19910711 2024/05/05
    "歴史的経緯: ggplot2の開発を始めたころ私はあまりよいRのプログラマではありませんでした / ggplot2: mutableなオブジェクトのためにprotoを使って始まり + mutatrや参照クラスやR6よりずっと昔 + protoだけが唯一の選択肢だった" 2016
  • 私とProcessingときっかけ

    なぜこの記事を作成したのか Processingを始めたきっかけや魅力に気づいたきっかけなど、さまざまな「きっかけ」を今なら言語化できるのでは?と感じ、記事として残そうと思いました。 また過去に募集した質問箱でも「きっかけ」や「理由」を尋ねてくる質問が多かったのもあって具体的に答える形で書いてみます。 ritocoの歴史みたいな視点で見てくれたら幸いです。 目次 なぜこの記事を作成したのか 目次 私について Processingって? Processingを知ったきっかけ Processingの授業を受講したきっかけ Processingの魅力に気づいたきっかけ Processingで自主制作したいと思ったきっかけ Processingを深く学ぶ・知ることになったきっかけ Processing作品を投稿しようと思ったきっかけ 今日までのアウトプットのきっかけ 様々なきっかけがあって 私につ

    私とProcessingときっかけ
    sh19910711
    sh19910711 2024/04/05
    "Processingのよさ: 成長が目に見えてわかる + 「ちょっとした思いつき→ 動かす → 発見」のProcessing無限ループにいつのまにか楽しくハマって / 制作してきたものは駄作でも残しておく" 2019
  • ggforce パッケージの geom_mark_* 関数が便利な件について - ほくそ笑む

    今年の5月に『Rによるインタラクティブなデータビジュアライゼーション』というを出しました。 Rによるインタラクティブなデータビジュアライゼーション: 探索的データ解析のためのplotlyとshiny 作者:Carson Sievert共立出版Amazon このは、主に plotly パッケージを使ってインタラクティブなグラフを作成するためのノウハウについて書かれています。 一方、このにはビジュアライゼーションのちょっとした小技やテクニックが所々に散りばめられていて非常に勉強になります。 例えば、第1章には、外れ値を強調するために ggforce パッケージの geom_mark_hull() という関数を使う例が載っています。 ggforce パッケージには、この類似機能として以下の4つの関数が含まれています。 geom_mark_rect() geom_mark_circle()

    ggforce パッケージの geom_mark_* 関数が便利な件について - ほくそ笑む
    sh19910711
    sh19910711 2024/03/13
    "今年の5月に『Rによるインタラクティブなデータビジュアライゼーション』という本を出しました / この本にはビジュアライゼーションのちょっとした小技やテクニックが所々に散りばめられていて" 2022
  • Google Colab + Matplotlibを使ったデータの可視化における2つの流儀とPandasのDataFrameのplotの話 - Qiita

    Google Colab + Matplotlibを使ったデータの可視化における2つの流儀とPandasのDataFrameのplotの話matplotlibpandascolaboratoryGoogleColaboratory データ分析やデータ加工にGoogle Colabを使用するメリットの一つに、Matplotlibを使った可視化がやりやすい点があります。 Google Driveから読み込んだCSVやBigQueryでのクエリー実行結果から、最低限のコードで手軽にグラフを作ることができ、視覚的にデータの内容をチェックできます。 複数のグラフを並べてレイアウトしたり、seabornを使ってより高度な可視化をすることもできます。 Google Colab + Matplotlib + PandasのDataFrameを使ったデータの可視化はとても手軽で便利な一方で、 「流儀」 の問

    Google Colab + Matplotlibを使ったデータの可視化における2つの流儀とPandasのDataFrameのplotの話 - Qiita
    sh19910711
    sh19910711 2024/02/18
    "Matplotlib: Explicit(オブジェクト指向)とImplicit(MATLAB風)という二つの流儀 + 同じようなことをそれぞれの流儀で実装することができます / 「流儀」 の問題があるため、学習で躓きやすい" / 2022
  • 大規模グラフデータの可視化:Cosmographの紹介

    テラーノベルで機械学習を中心に担当している川尻です。最近、グラフニューラルネットワーク(GNN)に注目しており、サーベイや検証をしております。以前にも以下の記事を書きました。 複雑なアルゴリズムを適用する前に、当たりをつけたり、結果を確認したりするためには、可視化が重要です。記事では、いくつかあるグラフの可視化ツールの中でも、大規模なネットワークでも簡単に使えるCosmographを紹介し、テラーノベルのデータを使って可視化してみます。 Cosmographとは グラフデータを可視化するツールはたくさんありますが、もっとも有名なのはgrapgvizです。graphvizにはsfdp[1]という大規模なデータに対応したアルゴリズムが用意されていますが、ノード数が10k以上のような大規模なグラフになると計算時間もかなりかかって、パラメータ調整も大変になります。 Cosmographは、Web

    大規模グラフデータの可視化:Cosmographの紹介
    sh19910711
    sh19910711 2023/09/07
    "Cosmograph: WebGLを使用して大規模なグラフをレンダリングできる + 100k以上のノードを持つグラフでも計算しながらレンダリング / npmパッケージとして公開されているため、自分でウェブアプリに組み込むことも可能"
  • 最近サイバーパンク風グラフ流行っていません? - Qiita

    まずはどんなグラフか? その特徴は * ネオンカラーを使う。 * 基線の前後に透明度の低い線を引いて、ボケ感を出す。 * 透明度の低い面装飾を追加して、ボケ感を追加する。 * 使用するフォントをサイバーっぽい物を使用する。 投稿のキッカケ matplotlib公式サイトにmatplotblogがあるのは、皆さんご存知でした? このサイトの最新の投稿がMatplotlib Cyberpunk Styleで上記のグラフの作成について解説しています。(2020/03/27 投稿) NHKスペシャル▽新型コロナウイルス瀬戸際の攻防〜感染拡大阻止(2020/4/11 PM9:00-PM10:04)でもサイバーパンク風グラフが使用されていました。(2020/4/11放送) [引用:NHKスペシャル:NHKプラス再配信から] R界隈でもサイバーパンク風グラフパッケージがリリースされています。(リリース

    最近サイバーパンク風グラフ流行っていません? - Qiita
    sh19910711
    sh19910711 2022/10/13
    2020 / "サイバーパンク風グラフ: ネオンカラー + 線の前後に透明度の低い線を引いて + 透明度の低い面装飾を追加 / 「見えない敵」に準えてサイバー感のあるグラフニーズがあるようです"
  • 誤読活動 – The Grammar of Graphics

    sh19910711
    sh19910711 2022/08/28
    "我々は SQL で aggregate したいが、Altair の可視化は SQL から分断されたオンメモリの世界で起こる / Polaris みたいに可視化仕様から SQL を生成して必要なデータ整形を全部済ませるアプローチが Python の世界に来てほしい"
  • ベクトル場をGPGPUで実装する | 永松 歩 | Ayumu Nagamatsu

    記事は「GPU で暖を取りたい人のための GLSL Advent Calendar 2016」の22日目の記事です。教祖doxasさんを始め技術的にもネタ的にもハイレベルで読み応えがある記事ばかり中、恐縮ですが掲題の拙ネタにて寄稿します。ちゃんとPCは暖かくなります。 完成した図像とコードを掲載します。 ベクトル場とは、流れるプールのように、特定の場所に特定の流れつまりベクトルが対応づけられている空間です。この空間に、ランダムな点群もしくは物体を配置すると、その位置に応じて速度ベクトルが付加され、流されるように動きだします。一般的には物理のシミュレーションで利用されますが、上手く流れをつくることで、審美的に優れた優美な動きや形態を得ることができます。 木圭子 記事を書くにあたって言及したい作家が、1980年台からコンピュータによるヴィジュアル・アートの先駆的存在として活動している木

    ベクトル場をGPGPUで実装する | 永松 歩 | Ayumu Nagamatsu
    sh19910711
    sh19910711 2022/06/11
    2016 / "木本圭子: 1980年台からコンピュータによるヴィジュアル・アートの先駆的存在 / 作品のほとんどが点描のみで構成 > 色彩は極めてシンプルな構成でありながら、この世のものとは思えない複雑さと有機的さ"
  • [R] [OpenStreatMap] 東京の道路データをグラフに要約する - ill-identified diary

    概要 そういや昔 shpファイルをspで読み込んでポリゴンデータをfortifyして属性データと結合してgeom_mapで描画するみたいな記事書いてたなと思い出したので最新の状況に更新しようかと思ったんですが、詳しい話はユタニさんが全部書いてるのでリンクだけ貼って誤魔化そうかな。。。— ill-identified (@ill_Identified) 2018年7月15日 ということで, 地理情報関係のことに関心が向いたところで, こんなツイートが流れてきた. これは面白い。世界の主な都市のストリートをその方角で集計した図。https://t.co/d09RKCmMRR 十字に近い都市は、格子状の街ということになる。北京やトロント。逆にぐちゃぐちゃなローマは円形に近い。コメントに「東京がみたい。あの道はクレージーだ」「東京と京都。全然成り立ちが違うし」 pic.twitter.com/vp

    [R] [OpenStreatMap] 東京の道路データをグラフに要約する - ill-identified diary
    sh19910711
    sh19910711 2022/05/29
    "都市の道路をベクトルとして扱い, polar plotすることで, 都市構造の傾向を視覚化 / polar plot: ヒストグラムを円周上に並べたもの / osmdata パッケージ: OSM では, 全ての地物に key と value のペアという形で属性データが登録"
  • seabornの細かい見た目調整をあきらめない - Qiita

    はじめに seabornの洗練されたスタイルで作ったグラフはとてもきれいです。見た目だけでなく、列の多いデータの全体像を把握するのにも威力を発揮します1。特に適切に整形されたデータフレームを渡せばカテゴリの比較や全パラメータの相関を一瞥できる図が一瞬で作れる機能は、同等の図をmatplotlibで一から作る苦労を考えると驚愕に値します。データサイエンティストやkagglerに人気があるのも納得です。また、複雑なデータを扱っていないけど単に見た目の良いグラフを作りたいという人の要望にも簡単に答えてくれます。可視化のお作法的にも見た目的にもだいたい勝手にいい感じにしてくれる手軽さが売りのseabornですが、ときには自分で調整したくなるときもあります。matplotlibだと面倒な調整を手軽にやってくれるseabornらしいメソッドで解決できるならいいのですが、たまにseabornのベースであ

    seabornの細かい見た目調整をあきらめない - Qiita
    sh19910711
    sh19910711 2022/05/29
    "かっこいいからという理由だけの多色化は可視化のご法度 / 色使いは、きちんと使えばデータからパターンを浮かび上がらせ、下手に使えば逆にそれらを隠してしまうという / プロットにおける他のどの要素よりも重要"
  • PyCaret が可視化を強化!! 〜Ver.2.3.6以降〜 [Google Colabで実行] - Qiita

    更新 ×:exp_name = setup(data = Boston, target = 'medv') ←誤りがありました。 ○:exp_name = setup(data = data, target = 'medv') AutoViz は、動作が不安定(起動初回は描画、2回目は描画しない時がある等)な場合は、セッション再起動するといけます。 はじめに PythonのAutoML(自動機械学習)といえば PyCaret。 PyCaretは、機械学習の一連の処理、可視化がほぼ自動で実行できるPythonのライブラリ。 このPyCaretが、 AutoEDAの「AutoViz」 機械学習モデルの各種可視化が可能な「ExplainerDashboard」 を統合したようです。 統合で実現された内容は、PyCaret のyoutubeチャンネルにアップされた動画をみるとよくわかります。 とい

    PyCaret が可視化を強化!! 〜Ver.2.3.6以降〜 [Google Colabで実行] - Qiita
    sh19910711
    sh19910711 2022/05/11
    "PyCaretが、AutoEDAの「AutoViz」+ 機械学習モデルの各種可視化が可能な「ExplainerDashboard」を統合 / AutoViz: スルーしようと思っていたのですが ~ 以前使った時よりも単独でインタラクティブなものになっています"
  • D3.jsと学ぶVisualization(可視化)の世界

    CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsNaoyuki Yamada

    D3.jsと学ぶVisualization(可視化)の世界
    sh19910711
    sh19910711 2022/05/03
    "データ分析のためのマントラ: 概観を見る + 徐々にズームしてフィルタリング + 必要に応じて詳細な分析をする (Ben Shneiderman)"
  • 高速 scatter plot 描画(apache-arrow + regl 利用) - Qiita

    こんにちは。 apache-arrow (IPC) データをプロットしました1。データ (columnar typed array) を取得しそのまま regl の WebGL バッファーへ書き込むことにより高速描画を行なっています。 この例のデータの取得(ダウンロード)進行中は、データは逐次分割されて取得され(10,000行単位)、その都度、データを追加して描画しています(ストリーム型処理)。 ただし、データの取得自体はネットワークを通したダウンロードなので高速ではありません2 3。 ソースおよび実行例はこちら、 regl + apache-arrow: fast WebGL scatter plot (bl.ocks.org) 参考:Efficiently loading massive D3 datasets using Apache Arrow (Chris Price, scot

    高速 scatter plot 描画(apache-arrow + regl 利用) - Qiita
    sh19910711
    sh19910711 2022/04/05
    よさそう👀 / "データを取得しそのまま regl の WebGL バッファーへ書き込むことにより高速描画 / データをローカルファイルとして読み込むと、開始後ほぼ一瞬で全データを描画完了できます"
  • Rでベクトル場を図示する

    ベクトル場がxy座標の式で与えられているときに、それがどんな場を表しているかは、具体的にいくつかのベクトルを図示してみると、なんとなく見えてきたりします。 f(x, y) = (x, y) みたいな単純なベクトル場でさえ、慣れてないとイメージわかなかったりしますよね。 Rで図示してみましょう。(唐突) # # ベクトル場を表す関数 # f <- function(x, y){ X <- x Y <- y return( c(X,Y) ) } # # 矢印を描画する関数 # write_arrow <- function(x, y){ a <- 0.1 # 矢の長さ(比率) b <- 0.05 # 矢尻の長さ arrow_head <- f(x, y) * a # aの値で長さを調整 arrows( x, # 矢のx座標(from) y, # 矢のy座標(from) x + arrow_he

    Rでベクトル場を図示する
    sh19910711
    sh19910711 2022/03/27
    "f(x, y) = (x, y) みたいな単純なベクトル場でさえ、慣れてないとイメージわかなかったりします / 絵に描いたところで問題が解けるというわけでもないですが、なんかこう、気分がのってくる"
  • plotly.expressのお気に入りグラフ3選 - Qiita

    データ可視化アドベントカレンダー1日目の記事です。 データ可視化する際によく使うグラフは何でしょう?案外折れ線グラフとか、棒グラフとかそんな感じだったりするかもしれません。地味だけど分かりやすいんですよね。でも、そういうのってお気に入りとは言えないような気もします。 お気に入りってのは属人的なものです。その人の性格が現れます。私は能天気+めんどくさがりなので、少ない文字数で派手なグラフが好きです。というわけで、plotlyのラッパーであるplotly.expressを使って簡単に書ける、お気に入りの3つのグラフを紹介します。 アニメーション散布図 いきなり普通の散布図かよって感じですが、これは引数animation_frameに渡した要素が再生ボタンを押す、もしくはスライダを動かすと、散布図がanimation_frameで指定した要素をもとに変化します。 次の散布図はplotlyのgap

    plotly.expressのお気に入りグラフ3選 - Qiita
    sh19910711
    sh19910711 2022/03/18
    便利っぽい👀 / "アニメーション散布図 / スライダを動かすと、散布図がanimation_frameで指定した要素をもとに変化 / 下にスライダがありますが、それはデータのある年を示しており、その横の再生ボタンを押すと自動で動き
  • (小ネタ) terraform graph で該当するリソースだけ絞り込むスクリプト | DevelopersIO

    お疲れ様です。小島です。 terraform のリソースは増えていくにつれ、関係性について把握が難しくなるのではないでしょうか。 その時、依存関係を dot 言語で出力してくれる terraform graph があります。 しかし、多くのリソースが含まれる図には多くの関係を示す線が含まれており、把握するには一苦労です。 terraform graph には module-depth という深さを指定し、出力を絞り込むことができるオプションがあります。 ですが、スモールスタートでの開発で徐々にリソースが増えていくような場合だと、 module のリファクタリングは state も考慮する必要があるので後回しになりがちです。 なので、正規表現に該当するリソースだけ吐き出すようなスクリプトを go で書きました。 スクリプト スクリプトの使い方 # Glue に関するリソースを絞り込む ter

    (小ネタ) terraform graph で該当するリソースだけ絞り込むスクリプト | DevelopersIO
    sh19910711
    sh19910711 2022/01/28
    terraform graphでdot言語出力できるの知らなかった / "dot 言語の解析と出力には https://gonum\.org のライブラリを使用 / 数値計算用ライブラリ、とのことですが、グラフ言語に関するコードも入っていました"
  • Processingでお手軽3次元データビジュアライズ(地形編) - Qiita

    記事は、Processing Advent Calendar 2021の21日目の記事です。 昨年、一昨年に続き、Processingでお手軽に3次元データビジュアライズするシリーズです。 はじめに 昨今、「VR」「メタバース」「デジタルツイン」という言葉に代表されるように3次元表現が注目されつつありますが、Processingでも意外と簡単に3次元の地形を再現することができます。今回は「標高モデル」というオープンデータのビジュアライズとクリエイティブ・コーディングを組み合わせる内容です。 データさえ用意すれば日全国どこの地形でも表示できますが、今回はお正月向けに富士山周辺の地形を使って遊んでみます。 サンプルコードはこちらからダウンロードできます。 文中のサンプルコードのファイル名と対応しているので適宜参照しながらお読みください。 完成例 前提条件 使用するライブラリは次の通りです。

    Processingでお手軽3次元データビジュアライズ(地形編) - Qiita
    sh19910711
    sh19910711 2021/12/26
    "Processingでも意外と簡単に3次元の地形を再現することができます / オープンデータを使って、データビジュアライズとクリエイティブコーディングを融合させる表現はまだまだ探究の余地がありそう"