[B! 統計] belka333のブックマーク

全国130万件の交通事故マップ-みえない交差点-プレミアムA：朝日新聞デジタル

人身事故が起きた全国130万件分の地点を日本地図に置き、あなたの近くに潜む危険な場所を可視化しました。各地の小さな交差点で交通事故が多発していることも明らかに。

belka333 2022/04/12

リンク

カルマンフィルターが自動運転の自己位置推定で使われるまで - TIER IV Tech Blog

はじめまして、ティアフォー技術本部 Planning / Controlチームで開発を行っている堀部と申します。今回は状態推定の王道技術「カルマンフィルター」が実際に自動運転で用いられるまでの道のりやノウハウなどを書いていこうと思います。みなさんはカルマンフィルターという言葉を聞いたことがありますでしょうか。カルマンフィルターとは「状態推定」と呼ばれる技術の一種であり、自動運転においては現在の走行状態、例えば車速や自分の位置を知るために用いられます。非常に有名な手法で、簡単に使えて性能も高く、状態推定と言えばまずカルマンフィルターと言われるほど不動の地位を確立しており、幅広いアプリケーションで利用されています。使い勝手に定評のあるカルマンフィルターですが、実際に自動運転のシステムとして実用レベルで動かすためには多くの地道な作業が必要になります。この記事では、カルマンフィルターが

belka333 2021/08/05

リンク

データ視覚化のプロが選ぶデータ分析のオススメ本32選

データ分析&データ視覚化のコンサルティングをしております、永田ゆかりと申します。これまで2000人以上の方にデータ分析や活用の研修・トレーニング講師、企業への分析コンサルティングをさせていただいており、仕事をさせていただく中で必要な本を読み続けているうちに、気がついたらデータ分析領域の本を200冊以上読んでいました。中でもデータビジュアライゼーション・視覚化の領域に関しては私自身の得意領域ということもあり、数多く読み込んでいます。本記事では数多くのクライアントの方々との問題解決に役立った知識・ノウハウが書かれている良書をご紹介させていただきますので、是非最後までご覧ください。データ可視化そのものについて知りたいたは、こちらの記事からどうぞ。データ可視化とは？その重要性や手法、よくある課題と解決策を解説データ分析における視覚化（ビジュアライゼーション）系のおすすめの本17選1 S

belka333 2020/03/23

リンク

孫さんがPCR検査を大々的にやるとツイートしたら、多くの方から医療崩壊が起こるというメッセージが来ているようですが、なぜ医療崩壊が起こるんでしょうか？に対するKenn Ejimaさんの回答 - Quora

belka333 2020/03/17

リンク

初めてのロバスト統計学① - Qiita

なんとなくロバスト統計の話がしたくなったので、、、データに外れ値が混入することによって、分析結果の信頼性が損なわれてしまうことは少なくありません。例えば、成人男性の身長の平均が知りたくて、成人男性5人分の身長を測定して記録したとします。しかし、入力の際に間違えて1人分の身長の0が多くなってしまい、次のようなデータが得られたとします。単位は $cm$ です。

belka333 2020/03/15

リンク

全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ

(Image by Pixabay) 「データサイエンティスト」の第一次ブーム勃興から6年余り、人工知能ブームに便乗した第二次ブームで人口に膾炙してから3年余り、気が付いたら何やかんや言われながらもデータサイエンティスト及びその類似職が、じわじわと日本国内の産業各分野・企業各社に広まりつつあるように僕の目には映ります。そういう背景がある中で、ここ1年ぐらいの間にそこかしこで目立つようになってきたのが「ゼロからデータサイエンティストを育てたいのだがどうしたら良いか」という相談や議論。割とあるあるなのが「取引先がデータサイエンティストを採用して商談の席に同席させるようになって、彼らがデータサイエンスの知識を駆使してビシバシ突っ込んでくるのだが、こちらにデータサイエンティストがいないので対応できない」みたいなお話。これは実はUSでも同様だと聞くので*1、案外洋の東西を問わない課題なのかもしれま

belka333 2019/11/18

リンク

食べログ3.8問題を検証 - クイックノート

先日、twitter上で食べログの星の数について、ある問題が話題になりました。食べログの闇として話題になったその問題とは、「評価3.8以上は年会費を払わなければ3.6に下げられる」というものです。食べログは飲食店についての口コミを集めるサイトで、その評価は実際のユーザーによって形成されるものとして広く認知されています。専門的なグルメリポーターでもなく、一般の人々の素直な感想を集めることで、その飲食店のリアルな価値が知れると期待して、利用しているユーザーも多いでしょう。それだけに、「食べログが評価を恣意的に操作しているかもしれない」という話は、瞬く間にネットで話題となりました。さて、この話は実際に行われていることなのでしょうか。食べログでは、当然評価点は公開されているので、このような恣意的な操作があれば、何らかの形で偏りが見つかるはずです。ということで、食

belka333 2019/10/08

リンク

決定木の可視化ライブラリ「dtreeviz」が凄かったのでまとめる - St_Hakky’s blog

こんにちは。決定木の可視化といえば、正直scikit-learnとgraphvizを使うやつしかやったことがなかったのですが、先日以下の記事をみて衝撃を受けました。そこで今回は、以下の解説記事中で紹介されていたライブラリ「dtreeviz」についてまとめます。 explained.ai dtreevizの概要 dtreevizとはより良い決定木の可視化を目指して作られたライブラリです。解説記事 : How to visualize decision trees Github : GitHub - parrt/dtreeviz: A python machine learning library for structured data. Sample Imagesdtreeviz/testing/samples at master · parrt/dtreeviz · GitHub 多

belka333 2018/10/01

リンク

機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub（https://github.com/ShoKosaka/Suumo）に上げておきますので興味ある方は参照ください。最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。データ探索まず、23区の中でどこが物件数が多いのかを

belka333 2017/11/10

リンク

生還した戦闘機が教えてくれること～選択バイアスの罠 - Feel Like A Fallinstar

久しくご無沙汰しておりました。書くネタ自体は山ほどあるんですが、本業が凄い勢いで動いているのでそっちに集中していましたです。さて、たまには分析チックなお話を。統計でガチガチの石頭になってしまわないように、常に僕が気をつけていることの1つが「選択バイアスの罠」です。生還した戦闘機、しなかった戦闘機あ、ちなみに、いまきは別に統計や分析の（アカデミックな意味での）専門家ではないので、そのあたりはご容赦を（汗時に1940年ごろ。世界は第二次世界大戦の真っ只中です。統計学者のエイブラハム・ワルドという方が戦闘機の脆弱性について調査していたそうです。帰還した戦闘機の大量のデータが彼の元に届きます。「入手したデータどれもが、戦闘機のある部分の被弾頻度が他の部分よりも過度に多いことを示していた。」さて、ここからどういう結論を導けばいいのでしょうか？（ちょっと立ち止まって考えてから読ん

belka333 2011/02/19

リンク

はてなブックマーク

タグ

関連タグで絞り込む (27)

統計に関するbelka333のブックマーク (10)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス