タグ

統計に関するwushiのブックマーク (19)

  • https://www.nhk.or.jp/kokokoza/suugaku1/assets/memo/memo_0000004160.pdf

    wushi
    wushi 2024/01/04
    NHK高校講座テレビ学習メモ 数学 I 第32回 平均
  • 気温には棒グラフを使わない - データ可視化ミニ講座(7)|荻原 和樹 / Kazuki OGIWARA

    棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。 代表的な例が気温です。気温は棒グラフではなく、折れ線グラフで表現するのが正しいです。 そもそも棒グラフは、棒の長さ(≒ 棒部分の面積)の比率と数値の比率を対応させることで視覚的に数値を比較するものです。したがって、数値が2倍なら棒グラフの長さも2倍になります。棒グラフにおいて、縦軸を省略してはいけないのはそのためです。 しかし、気温において「X倍」に意味はありません。気温が10℃から20℃に上がっても「10℃上がった」とは言いますが「2倍の暑さになった」とは言いませんよね。気温とは、水が凍る温度を0℃、水が沸騰する温度を100℃とする相対的な指標です。気温がマイナスになることはしばしばありますが、これは当に何かがマイナスになっている、失われているのではなく、水が

    気温には棒グラフを使わない - データ可視化ミニ講座(7)|荻原 和樹 / Kazuki OGIWARA
  • 統計不正、「身内」が監視 識者「官邸の意向効く恐れ」:朝日新聞デジタル

    厚生労働省の統計不正を受けた再発防止策として、政府は今月26日から内閣官房に31人の「分析的審査担当」を配置した。外部審査を強調するが、政府内の「身内」が監視する体制で、第三者性が確保できるか疑問の声が出ている。 厚労省の毎月勤労統計では、大規模事業所の全数調査を2004年から勝手に一部抽出調査にしていたことが発覚。18年1月からは勝手に数値を補正し外部に公表せずにいた。その後の一斉点検では、56の基幹統計のうち23統計で不正やミスが見つかった。 総務省の統計委員会は今年6月、各府省内の審査体制が不十分だったとして、統計の調査部署から独立した分析的審査担当を置くよう提言。政府は7月26日付で、各省のベテラン統計職員らを係長級~課長補佐級として内閣官房に配置した。厚労省など10府省にそれぞれ1~4人が常駐し、①公表前チェック②公表済み統計の点検③調査変更時の影響分析④ミス発覚時の対応――にあ

    統計不正、「身内」が監視 識者「官邸の意向効く恐れ」:朝日新聞デジタル
  • 経済統計学会「統計、権力から独立を」声明文を総務省に:朝日新聞デジタル

    厚生労働省の統計不正を受け、経済統計学会(会長=金子治平神戸大教授)が「政治権力から独立でなければならないという近代統計の原点に立ち返ることを願う」とする声明文を、総務省の統計委員会に出していたことがわかった。 声明文は2月21日付。「公的統計が機能を果たせなかったことが、わが国を無謀な戦争へと駆り立てた」と指摘。毎月勤労統計の不正について「国のあり方そのものを根底から揺るがしかねない」と批判した。また、2000年代初頭に国が統計予算や担当職員を削減したことが不正の一因となったと指摘した。 毎月勤労統計では、調査方法…

    経済統計学会「統計、権力から独立を」声明文を総務省に:朝日新聞デジタル
  • ラノベのタイトルが長くなったのはいつ頃か? タイトル文字数の長さを年別分布にした図表が興味深い

    ページはアフィリエイトプログラムによる収益を得ています ライトノベル(ラノベ)にタイトルの長い作品が多いというのは以前から言われていますが、その「ラノベのタイトルが長くなったのはいつ頃?」という疑問を調査してみた結果が興味深いです。 Twitterユーザーのジャンルコード探検隊(@GenreCodeLovers)さんが投稿したのは、「ラノベタイトル長年別分布」。ラノベ発行情報をまとめている個人サイト「ラノベの杜」のデータベースを元に、1975年~2018年までの作品タイトルの「文字数」(※)と「作品数」をチェックして1つの図表として作成しています。 ※サブタイトルや巻数なども含めた「文字列長」でのチェックしたとのこと 「ラノベタイトル長年別分布 ※タップで拡大します」。一番上が1975年で一番下が2018年。右にいくほどタイトル文字数が多い(画像提供:@GenreCodeLoversさ

    ラノベのタイトルが長くなったのはいつ頃か? タイトル文字数の長さを年別分布にした図表が興味深い
    wushi
    wushi 2019/02/22
  • データから真実を見抜くために抑えたい『因果推論』の基本 - ゆとりずむ

    こんにちは、らくからちゃです。 原価コンサルタント見習として、コスト・マネジメントのお手伝いをさせて頂いております。売上が増えても、製品を作るのに高い材料が必要だったり、工程が複雑で人件費が掛かるようだと利益には繋がりませんよね?そこで製品ごとに製造コストを計算して『いくらなら利益が出るのか?』『いま一番儲かっている製品はどれか?』といったことを分かりやすくお伝えするシステムの導入を支援させて頂いております。 お客様に『このコストは、この実績に連動して増減するから、これを基準に按分して...』なんてヒアリングをしながら設定作業を進めていくのですが、当にその考え方で良いのかなあなんて思うことはよくあります。そんなモヤモヤした気持ちを抱えながら屋さんに行った所、なかなか面白いを発見いたしました。 「原因と結果」の経済学―――データから真実を見抜く思考法[Kindle版] posted w

    データから真実を見抜くために抑えたい『因果推論』の基本 - ゆとりずむ
    wushi
    wushi 2017/03/05
  • 「一様乱数の平均値を正規乱数として代用する」という話をゆるふわ統計的に検証する

    「一様乱数を足し合わせて平均値をとった値は正規分布っぽくなるよ」というツイートを見かけて、「それって統計的にどうなんだろう?」という疑問が湧いたので検証してみました。 はじめに 昨日・一昨日ぐらいに Twitter 上でちょっとした話題になっていた アニメーションの監修で、「 Random();の代わりに、(Random()+Random()+Rrandom()+Random()+Random())/5.0f; を使うと、動きにコクが出る」と言ったら、ピュアオーディオ扱いされるのですが・・・これは根拠のあるアルゴです。 — 深津 貴之 (@fladdict) 2016年11月3日 というツイートに関連して、「一様乱数の平均値を正規乱数として代用する」的なツイートをちらほら見かけて気になっていたので、統計的に検証してみましたよ、というブログエントリです (このツイート自体に対して揶揄するつも

    「一様乱数の平均値を正規乱数として代用する」という話をゆるふわ統計的に検証する
  • Pythonで統計学を学ぶメリットは?勉強の手順も解説

    Pythonで統計学を勉強するメリット 統計学を学ぶにあたって、Pythonを利用するメリットを確認しておきましょう。 近年の統計業務は、Pythonを使ったアプリケーションで行うケースが増えており、Web上のノウハウや書籍が充実しています。これらを活用することで、統計学の知識が乏しい状態でも、Pythonを切り口として学習を進めやすくなっています。 煩雑な計算を省略できる Pythonは科学計算処理に必要なライブラリが充実しています。Pythonのライブラリには、統計で用いられる専門的な計算式が内包されており、基礎的な考え方さえ理解していれば、具体的な計算式を知らずとも実践的な統計を実行可能です。もちろん読書や座学でも学習は可能ですが、Pythonを利用することで「煩雑な計算の理解」に時間を取られずにすむため「統計を使ってできること」をダイレクトに理解し易くなるでしょう。 データが簡単に

    Pythonで統計学を学ぶメリットは?勉強の手順も解説
  • 日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure

    2016年06月07日 日の産業分類別年収/労働時間ヒートマップ Tweet 厚生労働省は毎年産業分類別に賃金や労働時間の調査を行っている。10名以上の従業員を抱える5万余の民間事業所に対する調査をまとめたものであり、最新の調査結果は今年2月に公表された平成27年賃金構造基統計調査だ。 そこで同調査にもとづき、産業分類別の年収、月間労働時間をヒートマップにしてみた。男性・女性の降順にソートしたバージョンも用意しているのでそちらも見て欲しい。サムネイルをみるだけで、男女に厳然とした差があることが一目瞭然だ。 産業分類別年収テーブル(男性ソート版・女性ソート版) 産業分類別月間労働時間テーブル(男性ソート版・女性ソート版) 産業別明細票 さらに産業分類ごとに調査結果を確認できる検索フォームも用意した。上部のプルダウンメニューを選択することで、所望の産業の給与/労働時間テーブルを参照すること

    日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure
  • ソフトウェアのための統計学 – 後編 | POSTD

    次のステップ 統計学とエンジニアリングを統合する方法はたくさんあるので、うまく始められるように幾つかご紹介しましょう。 計測ツール 統計学の基に焦点を当ててきましたが、そもそも、どうやって関連するデータセットを生成すればいいのでしょうか? 私たちの答えは、コンポーネントの計測ツールを構造化することです。しかるべき所に正しいフックを使用すれば、私たちが問題をデバッグするために残業しても、パフォーマンスを向上させるために予備のサイクルがある時でも、データは必要な時に得られます。 PayPalのPythonサービスの堅牢性の多くは、信頼性の高いリモートロギング基盤によるものです。そしてこれは rsyslog と似ていますが、より強力なものです。それでも、データを上流に送信する前に、このプロセスは内部の指標を収集する必要があります。メジャーリリースがもう間近なので、2つのオープンソースプロジェク

    ソフトウェアのための統計学 – 後編 | POSTD
    wushi
    wushi 2016/05/05
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 実務で使う統計手法は、5つ。すごい、そんなシンプル?

    このセミナー、冒頭の渋谷 直正さん(日航空 旅客販売統括部Web販売部 1to1マーケティンググループ アシスタントマネジャー)のお話がとても参考になりました。 まず、渋谷さんはご存知のように、2014年に「データサイエンティスト・オブ・ザ・イヤー」を受賞され、ビジネス・サイドにおける、データサイエンスのリーダー的存在です。 その渋谷さんの「実務で使う分析手法は5つで十分、マーケターこそデータサイエンティスト候補」という講演は、多くの示唆に富んだものでした。 まず、みなさんが気にしている5つの手法とは、 クロス集計 ロジスティック回帰 決定木 アソシエーション分析 非階層的クラスター分析(k-meansなど) の5つです。統計の教科書にはさまざまな手法が出てきますが、マーケターが実務で使うのはこの5つ程度だと説明されるのです。でも、この説明には、私も思い当たる部分があります。東大数学

    実務で使う統計手法は、5つ。すごい、そんなシンプル?
    wushi
    wushi 2015/09/03
  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
  • グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース

    ウソグラフの世界 ここ数年、統計学がブームとなっています。オープンデータやビッグデータなど、IT化の進展とともにそれまで以上にさまざまな数字が扱われるようになっています。 そんな統計において、欠かせないものがグラフです。数値を図形化して視覚的な理解をうながすグラフには、棒グラフ、折れ線グラフ、円グラフなどなど、さまざまな種類があります。 ただ、意図的かどうかはさておき、作為が加えられたグラフを見かけることも珍しくありません。数値に手を加えることはもってのほかですが、それよりも目立つのは見せ方を工夫(作為)して実際の数値以上の効果や影響を錯覚させようとするものです。そうしたものは、「ウソグラフ」あるいは「クソグラフ」などと呼ばれたりします。 それでは、こうしたウソグラフにはどういうものがあるのでしょうか? 電子コミック市場は急成長? 先日『News Picks』という新興のネットメディアに、

    グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース
    wushi
    wushi 2015/02/17
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • 文系がゼロから統計を勉強するときに最初の1年で読むべき本 - StatsBeginner: 初学者の統計学習ノート

    最初の1年で読むべきを考える 私の統計学の理解はまだまだ初歩レベルに留まっていますが、昨日飲んでる時に「初心者向けの統計のってどういうのが分かりやすいですか」というようなことを訊かれて、「俺に訊かれてもあまり参考には……」とか思う一方、まだ初歩レベルの位置にいる人間だからこそ言える「このが分かりやすかったよ論」ってのもあるよなと思ったので、現時点での読書感想みたいなものをメモしておきます。一昨年、統計の勉強を始めた頃の自分にむかって書いてる感じです。 理系の人とか、ある程度統計の理解ができている人からみれば、「質的な理解のためにはもっと難しいがいいよ」ってなるかも知れませんが、「いやそんな難しいの勧められても独学のモチベーションが続かねーよ」っていう立場でまとめておきますw ここでは、 統計の勉強はしたことがなく、標準偏差とか言われても意味分からない プログラミングも全くわからな

    文系がゼロから統計を勉強するときに最初の1年で読むべき本 - StatsBeginner: 初学者の統計学習ノート
    wushi
    wushi 2014/10/02
    心理的統計学ってなんぞ
  • 人口減少地図:日本経済新聞

    民間の日創成会議(座長:増田寛也元総務相)が全国の市区町村の半数を人口減少によって「消滅可能性がある」と発表、地方自治体などに衝撃が広がっています。「人口減少地図」は創生会議や総務省の関連データを市区町村ごとにマッピングしました。お住まいの自治体やふるさとの「危機」がひと目でわかります。

    人口減少地図:日本経済新聞
  • benli: BSAによる「違法コピー率」の算定方法

    今年報告された「第4回 BSA&IDC 世界ソフトウェア 違法コピー調査」では、「違法コピー率」の算出方法について、従前の報告書よりは詳細な記述がなされています。 これによれば、 当該年度中に使用が開始されたパッケージソフトウェア数を算出 当該年度中に販売された、ないし合法的に取得されたパッケージソフトウェア数を算出 1の数字から2の数字を引いて、違法コピーソフトウェア数を算出 違法コピーソフトウェア数が明らかになれば、インストールされている違法コピーソフトウェアの全体に占める割合である違法コピー率を算定することができます。 とされています(同報告書12頁)。 すなわち、BSAが考える「違法コピー」には、現在多くのパッケージソフトにおいてメーカー自身も認めている「同時に稼働させない限度での複数台コンピュータへのインストール」はもちろん、「パソコンの買い換え等における旧パソコンで使用していた

    wushi
    wushi 2007/07/13
    じゃあどうしろっていうんだ的な
  • 生態学データ解析 - 生態学会大会2007

  • 1