CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsNaoyuki Yamada
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsNaoyuki Yamada
先日のエントリではメディアンの選択にsort()を用い、より効率のよいメディアンの選択方法を課題としました。 さて、今回そのアイデアの一つとして紹介するのはQuick Selectというアルゴリズムです。Quick Selectというアルゴリズム名は一般的ではないかもしれません。また、原典でも異なる呼称がなされている可能性があります。 Quick Selectはかの有名なアルゴリズム、Quicksortの分割部分を利用したアルゴリズムです。QuicksortはC. A. R. Hoareから1962年にComputer Journalにて発表されており、先日紹介したkd木と同様、1980年代に書かれた名著アルゴリズム Cに取り上げられています。日本語版では第1巻、整列のクイックソートの章に掲載されています。 Quick Selectは以下のような特徴を持っています。 平均的に線形時間で走る
Citation Viewer この記事は iwashi_serが執筆しています. Paperpileに登録している論文情報を可視化するアプリケーションを作成しました. その経緯や,アプリケーションの使い方,技術的な補足説明を行います. TL;DR アプリケーションはこちら 使い方はこちら Pythonで解析を行いたい方はこちら 背景・モチベーション 論文の解析,特にネットワーク解析は古来よりある研究分野であり,著者の関係や論文の関係などをグラフ化し,経路検索やネットワーク中心性の計算や,シーズ探索を目的としているものがあります. 今回の私のモチベーションは,自分が読んだ(登録した)論文の範囲の中の関係性を可視化して整理したいと思った,というものです.世の中には論文を検索して,その論文の引用関係などを可視化するアプリケーションなどはたくさんありますが,自分が読んだ範囲で,というものは見当た
こんにちは。 apache-arrow (IPC) データをプロットしました1。データ (columnar typed array) を取得しそのまま regl の WebGL バッファーへ書き込むことにより高速描画を行なっています。 この例のデータの取得(ダウンロード)進行中は、データは逐次分割されて取得され(10,000行単位)、その都度、データを追加して描画しています(ストリーム型処理)。 ただし、データの取得自体はネットワークを通したダウンロードなので高速ではありません2 3。 ソースおよび実行例はこちら、 regl + apache-arrow: fast WebGL scatter plot (bl.ocks.org) 参考:Efficiently loading massive D3 datasets using Apache Arrow (Chris Price, scot
ベクトル場がxy座標の式で与えられているときに、それがどんな場を表しているかは、具体的にいくつかのベクトルを図示してみると、なんとなく見えてきたりします。 f(x, y) = (x, y) みたいな単純なベクトル場でさえ、慣れてないとイメージわかなかったりしますよね。 Rで図示してみましょう。(唐突) # # ベクトル場を表す関数 # f <- function(x, y){ X <- x Y <- y return( c(X,Y) ) } # # 矢印を描画する関数 # write_arrow <- function(x, y){ a <- 0.1 # 矢の長さ(比率) b <- 0.05 # 矢尻の長さ arrow_head <- f(x, y) * a # aの値で長さを調整 arrows( x, # 矢のx座標(from) y, # 矢のy座標(from) x + arrow_he
データ可視化アドベントカレンダー1日目の記事です。 データ可視化する際によく使うグラフは何でしょう?案外折れ線グラフとか、棒グラフとかそんな感じだったりするかもしれません。地味だけど分かりやすいんですよね。でも、そういうのってお気に入りとは言えないような気もします。 お気に入りってのは属人的なものです。その人の性格が現れます。私は能天気+めんどくさがりなので、少ない文字数で派手なグラフが好きです。というわけで、plotlyのラッパーであるplotly.expressを使って簡単に書ける、お気に入りの3つのグラフを紹介します。 アニメーション散布図 いきなり普通の散布図かよって感じですが、これは引数animation_frameに渡した要素が再生ボタンを押す、もしくはスライダを動かすと、散布図がanimation_frameで指定した要素をもとに変化します。 次の散布図はplotlyのgap
文化庁が提供するメディア芸術DBには膨大な量のマンガ・アニメ・メディアアート等の情報が格納されている そこで,約47年分の週刊少年サンデー・ジャンプ・チャンピオン・マガジンのデータを用いて,データビジュアライゼーションの教材を作成した 2022年2月13日に開催された第2回メディア芸術データベース活用コンテストのビジュアルクリエイション部門にて最優秀事例賞を受賞した ちょまどさんおよび関係者の皆様にたくさん宣伝して頂いた(ありがとうございます!) 作ったもの 概要 1970年7月27日から2017年7月6日までの約47年間分の四大少年誌(週刊少年サンデー,週刊少年ジャンプ,週刊少年チャンピオン,週刊少年マガジン)の掲載データを使ってデータビジュアライゼーションについて学ぶWebサイトを作成しました. データは文化庁,メディア芸術データベース(MADB Lab)のデータセットを用いました.M
お疲れ様です。小島です。 terraform のリソースは増えていくにつれ、関係性について把握が難しくなるのではないでしょうか。 その時、依存関係を dot 言語で出力してくれる terraform graph があります。 しかし、多くのリソースが含まれる図には多くの関係を示す線が含まれており、把握するには一苦労です。 terraform graph には module-depth という深さを指定し、出力を絞り込むことができるオプションがあります。 ですが、スモールスタートでの開発で徐々にリソースが増えていくような場合だと、 module のリファクタリングは state も考慮する必要があるので後回しになりがちです。 なので、正規表現に該当するリソースだけ吐き出すようなスクリプトを go で書きました。 スクリプト スクリプトの使い方 # Glue に関するリソースを絞り込む ter
こんにちは、@ketancho です。みなさんは "ゲーミフィケーション" という言葉をご存知ですか?日頃の行動であったり、勉強であったりに、ゲーム的な要素を加えることでその効率や成果を高めるもの、と私は理解しています。最近 Progate を始めたのですが、コンテンツを進めると "レベル" が上がる仕組みがあり、まさにこれがゲーミフィケーションだと思っています。 私は「仕掛学」という本が好きなのですが(記事はこちら → 「仕掛学」を用いた「ついしたくなる」UXデザインを考える - log4ketancho)、この「仕掛学」の "ついやってしまう仕掛け作り" に近しいものがあると思っています。仕掛学は「"その瞬間" ついやってしまう」という短期的な行動を促しているのに対して、ゲーミフィケーションは「つい "継続" してしまう」という長期的な行動を促している点が違う気がするものの、"つい"、
Tableau を使う理由 Toggle sub-navigation Tableau とは データカルチャーの構築 Tableau Economy コミュニティ Salesforce Advantage Tableau のお客様 Tableau について Toggle sub-navigation ミッション 研究 受賞と称賛 Tableau Foundation Tableau における平等 製品 Toggle sub-navigation Tableau Tableau Pulse Data Management 埋め込み分析 CRM Analytics Enterprise Tableau Public 統合 最新リリース プランと価格 Toggle sub-navigation Pricing Calculator ソリューション Toggle sub-navigation Ta
(今回から河本の実験室の記事は、こっちに書くことにしました。そのうち過去記事も移転します。) "AR Sensor"というアプリを作りました。 データをARで投影することで、普通は見えない日常の中の様々な空間データを見えるようにするツールです。 例えばこんなふうに、Wifiルーターから出てくる電波の立体的な強弱を見ることができます(緑は電波が強いところ、赤は電波が弱いところ): AR Sensorで見るWifiルーターの上の電波強度 なんでこんなの作ったの? もともとは「週一ぐらいでどこからともなく流れてくる排水口の臭いのもとを突き止めたい」という家庭的な悩みを解決するためにこのツールを作りました。臭いの空間分布を可視化できれば、臭いの元がすぐに見つけられるんじゃないかと。 使っているうちにWifiや磁場などのスマホで測れる様々なデータに応用すると便利+教育的であることに気づいて、汎用的な
これを作るための準備 キーロガー OSX対応のやつ、caseyscarborough/keyloggerを利用した。 $ make して $ sudo ./keylogger すると /var/log/keystroke.log にじゃんじゃんログが溜まっていく。 ヒートマップ Keyboard Heatmap に貼れば良い。 ただしそのままだとctrl、⌘、shiftなどが動いてくれない。 JSを直す必要がある。 このJSに以下のように手を加える。 割り当ててる平仮名とかは適当。。 --- a/keyboard-layouts.js +++ b/keyboard-layouts.js @@ -2,6 +2,19 @@ app.LAYOUTS = { QWERTY: { "~": [35, 120, 70, 275], "`": [35, 120], + "コ": [50, 225], /
本記事は、Processing Advent Calendar 2021の21日目の記事です。 昨年、一昨年に続き、Processingでお手軽に3次元データビジュアライズするシリーズです。 はじめに 昨今、「VR」「メタバース」「デジタルツイン」という言葉に代表されるように3次元表現が注目されつつありますが、Processingでも意外と簡単に3次元の地形を再現することができます。今回は「標高モデル」というオープンデータのビジュアライズとクリエイティブ・コーディングを組み合わせる内容です。 データさえ用意すれば日本全国どこの地形でも表示できますが、今回はお正月向けに富士山周辺の地形を使って遊んでみます。 サンプルコードはこちらからダウンロードできます。 文中のサンプルコードのファイル名と対応しているので適宜参照しながらお読みください。 完成例 前提条件 使用するライブラリは次の通りです。
朝倉書店様よりご恵贈いただきました。 概要 データビジュアライゼーション ―データ駆動型デザインガイド― “Data Visualisation: A Handbook for Data Driven Design”第2版の翻訳。豊富な事例で学ぶ、批判的思考と合理的な意思決定による最適なデザイン。チャートの選択から配色・レイアウトまで、あらゆる決定に根拠を与える。可視化ツールに依存しない普遍的な理解のために! オールカラー。 第I部 基礎 1章 データ可視化の定義 2章 可視化デザインプロセス 第II部 背後の思考 3章 要綱を作成する 4章 データの処理 5章 編集的思考の確立 第III部 デザインソリューションの開発 6章 データ表現 7章 インタラクティブ機能 8章 注釈 9章 色 10章 構成 レビュー 本書は、visualisingdata.comの運営者であるアンディー・カーク
最近,仕事で使うことがあってたまたま気がついたのだが, PlantUML って JSON や YAML のデータを視覚化できるんだね。 やり方は簡単。たとえば { "firstName": "John", "lastName": "Smith", "isAlive": true, "age": 28, "address": { "streetAddress": "21 2nd Street", "city": "New York", "state": "NY", "postalCode": "10021-3100" }, "phoneNumbers": [ { "type": "home", "number": "212 555-1234" }, { "type": "office", "number": "646 555-4567" } ], "children": [], "spous
私たちがデータを表現する際に使われるグラフには多くの種類があります。円グラフはその中でもポピュラーなもののひとつですが、折れ線グラフや棒グラフと違って使い道が限られることもあり、積極的な推奨をされることは多くありません。 特に批判が多いのが、円グラフに厚みをつけて斜めの角度から表現した3D円グラフです。ExcelやNumbersといった多くの表計算ソフトで作成できるにもかかわらず、「3D円グラフは絶対に使ってはいけない」と主張する人も少なくありません。余談ですが私は「3D円グラフは法律で禁止すべき」というジョーク?をデータ可視化関連のイベントや懇親会などで3回ほど聞いたことがあります。すべて違う方でした。 ただ、ExcelやNumbersにしても、グラフとして実装しているからにはきっとユースケースを(たぶん)想定しているでしょうし、「ダメ」と言われると逆に何とかして可能にできないか考えたく
はじめに ポイントクラウドデータをいい感じに可視化したい. matplotlibでも3次元データのscatterを描くことができるが,以下のような感じでいまいちな見た目になってしまう. もうちょっといい感じの図が描きたい.たとえはこんな感じのやつ. 調べてみると,blenderでpythonが使えるらしいので,blenderなんもわからんけどやってみる. データはここで使われているShapenetの一部を用いた. 環境 Ubuntu 18.04 blender 2.80 ちょっと調べてでてくるスクリプトは動かないことが多かった(特にライト周り). 今使っているバージョン付近で大きめのアップデートがあったのか,blender自体がそういうアップデートの方針なのかわからないが,使っているバージョンによっては以下のスクリプトは動かないので注意. Blenderのインストール blenderはap
Azure Data Box Family Overview and Microsoft Intelligent Edge StrategyTakeshi Fukuhara
本記事は、Processing Advent Calendar 2019用に書きました。 はじめに 各都道府県の人口密度データを元に、平面地図上にデータに応じた高さを持ったバーを立てていきます。平面地図上でのデータマッピングを行う作品で有名どころでは、takramの「Planck」でしょうか。そこまでハイクオリティではないですが、サクッとやってみたい方には参考になるかと思います。また、他の地理情報への応用にも参考になるかと思います。 サンプルコードはこちらからダウンロードできます。 文中のサンプルコードのファイル名と対応しているので適宜参照しながらお読みください。 完成図 前提条件 Processingのバージョンと使用するライブラリは次の通りです。マウスで視点操作を行うので、ライブラリはPeasyCamを使います。 Processing3.5.3 PeasyCam 302 (訂正追記:2
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く