[B! analytical] teddy-gのブックマーク

teddy-g id:teddy-g

analyticalに関するteddy-gのブックマーク (19)

サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
teddy-g 2015/12/17
フーリエ変換のデータ分析への利用の超具体的な説明。

bigdata

statistics

analytical
リンク
Deep Learning の次は、TDA 「トポロジカル・データ・アナリシス」 (Topological data analysis) が来る ? ～その概要と、R言語 / Python言語実装ライブラリをちらっと調べてみた - Qiita
人工知能やデータ解析の領域で、膨大な量のデータから、物体概念（物体識別）や音声・体の運動スキーマ概念を自動的・自律的に獲得できる可能性をもった手法として、Deep Learning（ディープ・ラーニング、「深層学習」）と総称される手法が注目を集めています。こうした中、一部の研究者やベンチャー企業の経営者・エンジニアの中には、このDeep Learningのさらに先をいくデータ解析手法として、TDA：トポロジカル・データ・アナリシス (Topological data analysis) と呼ばれる手法に着目している方たちがいるようです。 Deep Learningと同じく、人間が脳を使って、五感で得た周囲や自分の体についての感覚情報から、どのようにして周囲の環境空間に対する認識イメージや、物体概念、みずからの身体概念を得ているのか？という「問い」に対して、統計学や確率論のアプローチではな
teddy-g 2015/11/05
なんか変な人にTDAがヲチされてんだけど。よく調べました。ぱちぱちぱち。

advanced

analytical

advancedanalytics

topology

TDA

homology

persistenthomology
リンク
Welcome to the Python Mapper documentation! — Python Mapper documentation
teddy-g 2015/11/05
MapperのOSS版ってことらしいんだがこれあったらAyasdi Coreいらないってこと？って早速インストールしようと思ったけど何かうまくいかん。つかドキュメント途中で切れてんだけど。

advanced

analytics

analysis

analytical

advancedanalytics

topology

TDA

homology

persistenthomology
リンク
Using Topological Data Analysis on your BigData
teddy-g 2015/03/05
AyasdiのTDA＝Persistent Homologyの説明と分析内容の説明。Persistent Homologyの適用法、分析の切り口がよくわかる。

bigdata

advanced

analysis

analytical

advancedanalytics

topology

manifold

homology

homotopy
リンク
ネットワーク分析 - ベイジアン・ネットワーク　 - yokkunsの日記
ベイジアンネットワークとは事象間の連関を確率的な仮定として、有向グラフを用いて表す方法。ネットワーク構造は、DAGでなければならないという制約がある。（原因と結果が循環的な構造になってしまうのを避けるため）ベイジアン・ネットワークをデータ分析に応用すると、変数間の連関を有効グラフで表す事が出来る。ベイジアン・ネットワークにおける有向辺の有無を決める基準には、確率的な「独立」が用いられる。このとき、なので、Aの確率はBの影響を受けない。このように2つの変数が独立、もしくはそれにちかければ、それらの間に連関は無いと考え、それらの変数を表すノード間にエッジは張られない事になる。ベイジアン・ネットワークの例データは、ネットワーク分析 (Rで学ぶデータサイエンス 8)に出てくる「ハイテク企業の管理職21人の社会ネットワーク」。ハイテク企業の管理職データ Age Tenure Dp
teddy-g 2015/02/15
Rでベイジアンをやる方法の丁寧な説明。

R

advanced

analytics

advancedanalytics

analytical

analysis

bigdata

statistics
リンク
マルコフ確率場 (MRF) と条件付き確率場 (CRF) の違い | LESS IS MORE
一番の違いは、生成モデルか識別モデルか、ということ。それぞれ、 Markov Random Fields (MRF) は生成モデル Conditional Random Fields (CRF) は識別モデルです。 What is exactly the difference between MRF and CRF ここを見ると割とすっきりする。ただ、少しスムーズに納得できないことがありまして…それは、MRFもCRFもグラフィカルモデルで書くと無向グラフとなること。識別モデルは無向グラフで生成モデルは有向グラフなんじゃ…？と思ってしまう人もいるんじゃないかと思う（いなかったらごめんなさい）。グラフィカルモデルとしての表現一般に、生成モデルは有向グラフの形で記述され、識別モデルは無向グラフとして記述される。例えば、隠れマルコフモデル (HMM) は有向グラフで、条件付き確率場 (CR
teddy-g 2015/02/09
MRFは生成モデルでCRFは識別モデルだが両方とも無効グラフ。RBMはMRFの一種。条件付き確率がよくわからなくなってきた。

analysis

analytics

analytical

bayes

bayesiannetwork

statistics

mrf

crf

deeplearning

rbm
リンク
Persistent Homology とRのphom package, その他libraryの紹介 - xiangze's sparse blog
高次元データの大域的な性質に着目した分類、解析の手法にPersistent Homologyという方法があります。またその手法を実装したRのパッケージ(CRAN phom package)があったので簡単に紹介いたします。その他の色々な言語で使えるライブラリについても最後に紹介いたします。ホモロジーについてホモロジーとはあまり厳密でない言い方をすると微小な変形によっては変わることのないものの形状を特徴づけるような量で、一般には群の形で記述されます。群の係数としては整数や複素数などの数だけでなく、関数もとり得ます。しかしデータ解析の分野においては実係数のホモロジー群のみが対象とされる場合が多いようです。球面、あるいはトーラス(ドーナツ型の図形)の表面は２次元ですが境目を持ちません。しかしながら全体としてみるとトーラスには穴が開いていて、球面には穴がありません。この穴に相当するものの有
teddy-g 2015/01/28
Persistent Homologyの日本語説明。わかりやすい。

advanced

analytics

analysis

analytical

advancedanalytics

bigdata

topology

homology
リンク
次元を下げる - ryamadaのコンピュータ・数学メモ
昨日の記事で、多様体学習に触れた多様体学習は、非線形に次元を下げる話と言い換えることができるが、それに関連する用語を挙げよう Isomap 点間距離を局所について測り、グラフ上の最短距離を局所において定める。その上で、すべての点間のグラフ上最短距離をそのつなぎ合わせとして決める。ペアワイズな最短距離が計算で来たら、それをユークリッド空間の距離のように見立ててMDSで低次元空間に埋め込む Kernel_PCA カーネル法(座標の計算をする代わりに内積計算をして計算量を減らす仕組みを使った方法)を文字込んだPCA拡張版。分解しやすいように、実際よりも次元を高くして分解できる条件を作ってやった上で、意味の大きい軸を引き出す Nonlinear dimensionality reduction methods これらを大きくくくるとNonlinear dimensionality reducti
teddy-g 2015/01/28
多様体学習のざっくりした説明。このくらいの理解でいいと思う。

analysis

analytical

advanced

analytics

advancedanalytics

manifold

isomap

kernel trick

pca
リンク
RBMから考えるDeep Learning　～黒魔術を添えて～ - Qiita
ずいぶん遅くなりましたが、ひとまず完成です。疑問点・翻訳ミスを始めとした指摘がありましたら、どしどしお願いします(14/12/18)。 1週間あるから大丈夫だろうとたかを括っていたら、あっという間に投稿日になってしまいました。本当はPylearn2を使ってRBMを学習させようと考えていたのですが、役に立つ内容を書くには時間が足りなさすぎるので、お茶を濁します。今回の目標 Restricted Boltzmann Machine及びDeep Belief Networkの基本的な動作原理を知る "A Practical Guide to Training Redstricted Boltzmann Machine"(GE Hinton, 2012)で黒魔術(RBMの性能を引き出すコツ)を学ぶ先日、以下のような発表をしました。今回の内容は以下のスライドの焼き直し・改良を含みます。参考にどう
teddy-g 2015/01/28
Deep LearningのRBMについて。AutoEncoderの方が理解しやすい気がする。

analysis

analytical

advanced

analytics

advancedanalytics

bigdata

deeplearning

rbm
リンク
Denoising Autoencoderとその一般化
Machine Learning Advenc Calendar 2013の23日目担当の得居です。株式会社Preferred InfrastructureでJubatusを作ったりしています。今日は深層学習(deep learning)の話です。深層学習はこの2年ほどで専門外の人にも知れ渡るほどに大流行しました。データさえ大量にあればテクニック次第で他の手法を圧倒する性能を達成できることから、特に大量のデータを持つ大企業において大々的な参入が相次ぎました。主に流行っているのは教師あり学習です。補助として教師なし学習による事前学習(pretraining)も、特に音声認識のタスクにおいては行われているようですが、画像認識を中心に事前学習なしでもテクニック次第で学習できるという見方が強まっています。一方で教師なしデータからの学習はブレイクスルー待ちといった雰囲気です。 Deep
teddy-g 2015/01/27
やっぱりDenoising Autoencoderは多様体学習と捉えられるとあるな。なるほど。

analysis

analytical

advanced

analytics

advancedanalytics

bigdata

deeplearning

autoencoder
リンク
Hello Autoencoder — KiyuHub
Hello Autoencoder 最近，身内でDeep Learningを題材に含んだ勉強会を行なっている．メインは専門である自然言語処理まわりだが，とりあえず実装(というよりnumpy)の導入になる上，結果を視覚化できることから，画像データを利用したAutoencoderの実装について取り扱った．軽い説明と共にコードと，色々な結果を Autoencoder Autoencoderとは,Neural Networkの特殊系で，基本的には入力層と出力層のユニット数が同じである．教師信号として入力そのものを与える．という特徴を持つ．入力と出力が共に4次元で，隠れ層が2次元なAutoencoderの図 Autoencoderは，入力の情報をを一度隠れ層の空間に写像(encode) したあと，元の信号を復元(decode)するようなパラメータを学習する．図のように，もしも隠れ
teddy-g 2015/01/27
入力層→Encode→隠れ層→Decode→出力層、で隠れ層が入力層より小さければ次元圧縮。で、Decodeするってことは連続写像と同じ？

analytical

analysis

advanced

analytics

advancedanalytics

bigdata

deeplearning

autoencoder
リンク
経験損失最小化 – ERM (1) | パターン認識と機械学習
決定理論予測するとは？分類問題の目標は、観測したxがどのクラスに属するのかをはっきりと知る事。そのための手法は「識別関数」「識別モデル」「生成モデル」の３つあるが、その前にまず「決定理論」と「そうでないもの」の２つに大別される。以下、言葉の意味を整理する。・決定理論「推論」と「決定」の２段階に分ける手法。・そうでないもの２段階に分けない手法。これが３つの手法のうちの１つ目の、識別関数。パーセプトロンやSVMがそう。訓練データから識別関数f(x)を求め、未知の入力データxにそれぞれに対し、どのクラスに属するかの答えを直接与える手法。確率を用いず、例えば2クラス分類であれば陽性と陰性との間の境界線のみを求める。決定理論とは？「推論」とは、訓練データから事後分布p(Ck|x) をモデル化する事。識別関数が陽性/陰性を一発ではっきりと答えを出すのに対し、この患者xが陰性であ
teddy-g 2015/01/27
識別関数、識別モデル、生成モデルの説明はこの記事が一番分かりやすいと思った。

analysis

analytical

advanced

analytics

advancedanalytics

bigdata
リンク
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会第3回DL勉強会発表資料)
2014年11月13日開催の全脳アーキテクチャ若手の会第3回Deep Learning勉強会の資料です。RBMの動作原理をポイントを押さえて解説しました。参考資料を後ろに纏めましたのでご自由にご活用ください。
teddy-g 2015/01/27
つまるところRBMというのは対象データの分布を模倣するように学習するからPre-Trainingすると精度が上がるということでいいのかしら。

analysis

analytical

advanced

analytics

advancedanalytics

bigdata

deeplearning

neuralnetwork
リンク
機械学習超入門〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei
最近では機械学習の認知度も上がってきていて専門家でなくてもナイーブベイズやSVMなどの名前を知っている人も増えてきたように思う。そんなわけでちょっと機械学習をはじめてみようかな、と思っている人も多いのではないだろうか。とはいえ「数式よくわからない」「確率嫌い」といった理由で尻込みしているケースも多いのでは。そこで予備知識ゼロでもわかるような機械学習の入門記事を書いてみたよ。機械学習を「作りたい」のか「使いたいのか」まず最初に確認したいのがこれ。使いたいだけならまずはSVMを使ってみれば良い。世の中にはlibsvmやsvmlightという良いツールがあるのでそれを使おう。以下の記事は機械学習を「作りたい」「仕組みを知りたい」人向けの内容になっている。「最も簡単な機械学習はナイーブベイズ」という幻想機械学習といえばナイーブベイズという話がよくある。ナイーブ(単純)という名前からいか
teddy-g 2015/01/27
機械学習のほとんどは線形識別器であり線形識別できるようにする技術がメインだったりするな。コメントにある通り主観的な部分も多く、流行のDeep Learningなんて識別関数なのか識別モデルなのか生成モデルなのか。

analysis

analytics

analytical

advancedanalytics

bigdata

bayes

bayesiannetwork
リンク
最大エントロピーモデルについて（CRF への前振り） - アスペ日記
最大エントロピーモデルについての解説。既存の資料としては、A Simple Introduction to Maximum Entropy Models for Natural Language Processing や「言語処理のための機械学習入門」（通称高村本）が詳しい。記事中でもその用語を適宜使ったり、内容を引用したりする。ここでは、できるだけ直感的に理解できるような説明を目指す。まず、最大エントロピーモデルとは何か。最大エントロピーモデルは、分類を行う時に使われる。たとえば、あるレビューに出てきた単語（good とか bad とか）から、そのレビューがポジティブなのかネガティブなのか分類する、というようなもの。この分類先のことをクラスと呼ぶ。最大エントロピーモデルは識別モデルの一種。識別モデルの他には生成モデルというものもある。これらの違いは、レビューの例で言う
teddy-g 2015/01/27
識別モデルの代表格・CRFを理解する為にエントロピーを調べてたら行き当たった。途中まではフムフム、と読み進める。

advanced

analytics

advancedanalytics

analytical

analysis

bigdata

bayes

bayesiannetwork
リンク
Ｒとカーネル法・サポートベクターマシン
図1に示すように、非線形データ構造を線形構造に変換することができれば、線形データ解析手法で非線形データを容易に扱うことができる。データを変換することで、非線形構造を線形構造に変換することが可能である。例えば、図2(a)に示す2次元平面座標系(x,y)上の4つの点A1(1,1)、A2(1,-1)、A3(-1,-1)、A4(-1,1)を考えよう。仮にA1とA3がひとつのクラス、A2とA4がひとつのクラスだとすると、平面上でクラスの境界線を一本の直線で引くことができない。しかし、新しい変数を導入し、2次元平面(x,y)上の4つの点を3次元空間(x,y,z)に射影するとA1(1,1,1)、A2(1,-1,-1)、A3(-1,-1,1)、A4(-1,1,-1)になり、両クラスは平面で切り分けることが可能である。例えば，z=0の平面を境界面とすることができる。図1では、関数φ(x)を用いて個体
teddy-g 2015/01/27
Rを使ってカーネルSVMを使う説明だが、カーネルPCAの説明もある。

advancedanalytics

advanced

analytics

analysis

analytical

kernel trick

svm

pca
リンク
MDP
teddy-g 2014/11/19
Pythonで書かれた教師なし学習のパッケージ。PCAからGNG、RBMなんかもパッケージされてるらしい。スゲエ。

analytics

analysis

analytical

bigdata

deeplearning

machinelearning

unsupervisedlearning
リンク
RNNLM
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural imagesDeep Learning JP
teddy-g 2014/11/17
自然言語分析にNNを使う＝NNLM。単語の出現確率を元にアレでコレして推測する。

neuralnetwork

morphological

analysis

analytics

analytical

deeplearning

bigdata
リンク
技科大坂の上で | Growing Neural Gas
teddy-g 2014/09/25
Growing Neural GasをJavascriptで実装した例

analytics

analysis

gng

analytical

javascript
リンク
1