タグ

統計に関するXenosのブックマーク (13)

  • ChatGPT活用を激震させる新機能「Code Interpreter」にNetflixをデータ解析させたらスゴかった

    コード・インタープリターはChatGPTの有料版「ChatGPT Plus」で、GPT-4の付加機能として呼び出せる。 画像:筆者によるスクリーンショット ChatGPTの有料版である「ChatGPT Plus」(月額20ドル)には、7月初めから「Code Interpreter(コード・インタープリター)」という機能が追加された。 この機能が画期的だとして、一時ネットでは大いに話題になった。これまでは面倒だった「データ集計」などを、チャットの命令だけで実行できるからだ。 データ集計は、Excelなどの表計算ソフトやPythonなどのデータ処理に強いプログラミング言語で処理することが多い。 しかしコード・インタープリターでは、それらを使う必要はほとんどなく、データさえ用意できればいい。さまざまな手間がほぼゼロになり、ChatGPT任せにできる。 そうはいってもピンと来ない人も多いはず。そこ

    ChatGPT活用を激震させる新機能「Code Interpreter」にNetflixをデータ解析させたらスゴかった
  • 統計学で避けて通れない自由度の話 | 豆蔵デベロッパーサイト

    他の説明も見つけました。それは 観察値の数から推計値を除いた数 のような説明でした。 観察値の数というのは上記の例で言えばa, b, cの3つです。 このa, b, cから計算された「平均」という値は”推計値”です。 観察値の数”3”から、推計値である平均の値の数”1”を引くとそれが”自由度”であると考えます。 これは単に”自由度というものをそのように設定した”というだけで、ここまで聞いても腑に落ちません。 自由度を使う場面は分散の計算でお目にかかります。 分散を使って調べてみましょう。 あるデータの母集団からサンプリングされたデータ数nの”標平均”の計算は xˉ=∑i=1nxin\bar{x} = {\sum_{i=1}^{n} {x_i} \over n}xˉ=n∑i=1n​xi​​ です。これはいままで通り。 データのばらつき(分散)を考えるときは、偏差の和は ∑i=1n(xi−x

    Xenos
    Xenos 2022/10/25
    数学 自由度
  • [pdf] フィットネスクラブの動向 - 経済産業省 フィットネスクラブの売上高と前年同月比の推移

  • 自分がどのくらいエコーチェンバーの中にいるのか可視化するシステムを作ってみた|tori

    「ツイッターで見た」計算社会科学という学問があります.社会科学にコンピュータサイエンスを導入して,これまでにない分析を行おうという学問です.最近日でも計算社会科学会が発足するなど今盛り上がっている研究分野です. そんな計算社会科学の分野で扱われる課題の一つに,ソーシャルメディアによる社会の分断の分析があります.アメリカ大統領選や新型コロナ禍でフェイクニュースを目にする機会が多くなりましたが,フェイクニュースや偏った情報の取得は,人々を分断させ社会を混乱させると言われています. 分断を生み出す要因の一つが,エコーチェンバー現象にあると言われています.これは,ソーシャルメディアなどでは自分と似たような価値観を持つ人とつながりがちであり,自分の意見をいうと周りから「そうだそうだ」と同意を得られ,自分の意見が社会全体の意見のように見えてしまう現象をいいます.実際にはソーシャルメディアで可視化され

    自分がどのくらいエコーチェンバーの中にいるのか可視化するシステムを作ってみた|tori
  • 研究が明らかにした「新型コロナ感染者の17.9%は無症状」 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    (徹夜シフトの交代時、全米の看護師の結束を呼びかけ、連邦政府からの援助を訴える看護師たち。カリフォルニア州ロサンゼルスで:Getty Images) もし自分が新型コロナウイルス(SARS-CoV2)を運んでいてそれに気づいていないとしたら? 知らぬ間に、ウイルスを他の人に移していたらどうだろう? 「無症状比率」とは、新型コロナウイルスに感染していながら、症状が表に出ないまま、無意識にウイルスを拡散している可能性のある人々の割合である。もしその数字がわかればおおいに役立つはずだ。ウイルスがどこまで広がっているのか、感染拡大をどう防げばよいのか、致死率はどの程度なのかを教えてくれるからだ。 実は、最近発表された二つの科学研究がこの比率の精度をさらに高めている。むろん完璧ではないから、鵜呑みにするのは避けたほうがいいだろう。それでも現3月18日の時点でベストの数字であるのは間違いない。 その一

    研究が明らかにした「新型コロナ感染者の17.9%は無症状」 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
  • 【うp1ヵ月後の実態】約6万データから見る人並みの値【さくさく統計】

    ・底辺制作者をこじらせたうp主が、人並みの値を知りたくて調べてみました。・抽出調査なので、実態と異なる場合があります。ご了承ください。 さらに、約6万と言いつつ実際は5万9千データですスミマセン。m(_ _)m・(New!) 続編作りました!うp1年後の実態 sm18166825・動画作成に、笛の踊りPさんの「六月の底辺」(sm14405855)という曲、およびRip Sync2とさなり様のイラストを 使わせて頂きました。どうもありがとうございました!・前:タグベスト50 sm14805149 次:タグ分析ツール sm16777562 統計とかリスト mylist/25931559(追記)ゆっくりラジオ日記様、広告どうもありがとうございました!m(_ _)m

    【うp1ヵ月後の実態】約6万データから見る人並みの値【さくさく統計】
  • 第 7 回アルゴリズムイントロダクション輪講会資料: Days on the Moon

    すでにニュースでも伝えられている通り、12 月 1 日に第 7 回アルゴリズムイントロダクション輪講会がありました。今回の担当は私だったので、その発表資料を公開します。 中央値と順序統計量 (その 1) 予定 順序統計量とは 選択問題とは 最小値と最大値 平均線形時間選択アルゴリズム 中央値と順序統計量 (その 2) 最悪線形時間選択アルゴリズム 3 つずつのグループに分割した場合 7 つずつのグループに分割した場合 参考文献 中央値と順序統計量 (補足) 4 つずつのグループに分割した場合 6 つずつのグループに分割した場合 Lazy-Select Randomized-Partition スタッフロール 「どうせ後から Web で公開するんだから、PDF とか見るのに手間がかかるものは使ってられないよね。やっぱ時代は XML 複合文書でしょ!」と、数式を表現するのに MathML を使

  • 世界の国の幼児の死亡率(男)・国別順位 [国連人口基金UNFPA - 世界人口白書2005年度版]

  • データブック国際労働比較:統計情報/独立行政法人 労働政策研究・研修機構(JILPT)

    『データブック国際労働比較』は、経済、労働、雇用状況、勤労生活等に関する各国の統計指標を、国際比較が可能な形に編集・収録した年刊資料集です。なお2022年版より、ウェブ版のみ提供しております(書籍での刊行・販売はございません)。 更新・訂正情報(2023年9月19日更新) データブック国際労働比較2023 データブック国際労働比較2023(全文)(PDF: 7.7MB) 2023年3月27日掲載 全文公開中最新号 分割版PDFExcelファイルは、詳細ページをご覧ください。(2023年4月27日掲載) データブック国際労働比較2022 2022年3月31日掲載 全文公開中 データブック国際労働比較2020 特別編集号 データブック国際労働比較2020 特別編集号— データで見るコロナの軌跡(PDF: 4.6MB) 通常の『データブック国際労働比較2020』は休刊となりますが、特別編集号と

  • 少年犯罪データベースドア:平成19年(2007)の殺人発生数は戦後最低

    2008年02月12日03:34 平成19年(2007)の殺人発生数は戦後最低 2/1に警察庁が去年の犯罪統計を発表したんですが、殺人の認知件数は1,199件で平成3年の1,215件を下回って戦後最低を記録しました。 検索した限りでは新聞はどこも報道していないようなんですが、テレビでもあつかってないでしょうか。これは大ニュースだと思うのですが。 ほんとにどこも報道していないのなら、こっちのほうも大ニュースですな。少年犯罪データベースのほうが新聞やニュース番組よりも正しい情報を流しているということが、これではっきりと時系列で示されたわけです。今日はウェブがとうとうマスコミを超えた記念日となりました。 ほんとですかいな。いくら日の報道機関が腐り切っているのは自明とは云え、これはさすがに信じられん。私が見逃しているだけなんでしょ。誰かそうだと云って。 情けないことに、ブログでも記している人が見

    少年犯罪データベースドア:平成19年(2007)の殺人発生数は戦後最低
  • なぜ生産効率が上がっているのにみんなあくせく働かなきゃいけないのか - 山に生きる

    昨日の続き。なんか伝わってないような気がするからちゃんと書いてみるけど、人が一定量を消費するとする。生産効率が上がる。生産者が少なくても消費量をまかなえるようになり、一部の生産者の仕事がなくなる。 ここで普通失業者が増えるわけだけど、現実では失業者は別に増えない。彼らは別の仕事に就き、何かを生産する。それはちゃんと消費されるので、彼らは生活できる。 つまり生産効率が上がれば上がるほど、消費の量は増える。生産効率が上がると原価率も下がるから安く手に入るし、同じ値段でも昔はもっと生産にコストがかかっていたような、高度なものが手に入る。リストラによって給料は上がってないので貯金されずにお金が消費に回る。よって生産効率が上がるほど、消費量が増える。 たとえば米を一ヶ月1キロ消費するとする。生産効率が上がり農家1人が今まで10kg生産できてたものが20kg生産できるようになった。農家2人に1人が廃業

  • 「九割は説明がつく」の説明の九割はこじつけ : 404 Blog Not Found

    2008年01月16日15:45 カテゴリMathArt 「九割は説明がつく」の説明の九割はこじつけ これを見てすぐおかしなことに気がついて、なぜそうなのかと考えたらある結論に達して、それについて[あとで書く]にしておいたら.... 戦前の少年犯罪 管賀江留郎 犯罪の九割は失業率で説明がつく重決定係数は0.91089、定数項と係数のp値はそれぞれ、1.83×10−19、2.55×10−26であった。とんでもなく有意である。 まさに相関45度(笑) 真打ちの「戦前の少年犯罪」の中の人が登場していた。 少年犯罪データベースドア:考える前にやるべきことがあるだろ 検挙率が変わるほど大幅な恣意的操作がなされている認知件数がどうして相関するのか? 基礎となる人口が変化しているのに、「率」と「数」がどうして相関するのか?人口当たりの認知率と失業率という「率」と「率」、認知件数と失業者数という「数」と「

    「九割は説明がつく」の説明の九割はこじつけ : 404 Blog Not Found
  • 犯罪の九割は失業率で説明がつく

    松尾匡のページ  08年1月14日 犯罪の九割は失業率で説明がつく (追記:1月16日, 再追記:1月17日) 続報あり。以下の分析結果には「誤差の系列相関」という問題がありました。続報ではその解決に取り組んでいます。 再追記:08年1月17日  下の方の昨日書いた追記で、管賀江留郎さんからいただいた批判のエントリーの中で言われていた、「警察がデータを操作したため相関する」という「説」について、管賀さんご自身の説であるように表現した一文がありました。私自身、気で言われていることかどうかは疑わしいと思っていましたが、ネタと断定することもできず、ああいう表現になりました。  このたび管賀さんとのやりとりの中で、これが管賀さんご自身信じておられない、いわゆる「釣り」のネタであることが明らかになりましたので、当該の表現を削除して訂正します。管賀さんはこれがひとつの積極的主張として一人歩

  • 1