並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 620件

新着順 人気順

確率分布の検索結果1 - 40 件 / 620件

  • 拝啓 コロナに関わるみなさまへ

    溜まった思いを書き散らしました。 拝啓 すべてのみなさまへワクチンを打って安心するのは、まだ早いです さすがに1回目の接種の翌日からマスクを外して動き回るような人はいないと思いますが、効果が十分あらわれるとされる2回目の接種から2週間経ってもなお、安心しないでほしいという話をします。あなた自身の重症化の確率は小さくなりますが、あなたが感染しなくなるわけではありませんし、あなたを経由して周りの人に感染させる可能性は十分に残っています。特にデルタ株に対しては、ワクチン接種後に他人との接触機会を2倍にしたら、あなたが打ったせっかくのファイザー製ワクチンの効果も、あなたが疑問視している中国製のワクチンを打ったのと変わらないレベルになってしまいます。まして、接触機会を5倍にしたら、ワクチンを打っていないのと同じです。周りの人のことを思いやれるなら、羽を伸ばすのは周りの人も含めてワクチンが行き渡ってか

      拝啓 コロナに関わるみなさまへ
    • 大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ

      先日、博士(情報学)になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatenablog.com 凡例:(半端)とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。 学部一年 寺田 文行『線形代数 増訂版』 黒田 成俊『微分積分』 河野 敬雄『確率概論』 東京大学教養学部統計学教室『統計学

        大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ
      • ノア・スミス「やっぱりもしかしてスマホがわるいのかも」(2023年3月2日)|経済学101

        By Matthew Yohe, CC BY-SA 3.0十代の子たちの不幸を説明するもっとも有望な要因「テレビなんてぶち壊せ / 新聞なんて投げ捨てろ / 田舎に行こう / 家を建てよう」――ジョン・プライン アメリカで広まっている十代の不幸について,興味を引く議論が続いている.発端は,疾病対策予防センター (CDC) の調査報告だ.これによると,アメリカの高校生たちのあいだで,哀しみや無力感が増えてきている.とくに女の子で顕著だ.たんに,聞き取り調査に対してみんながこれまでとちがう回答をしているだけじゃない.十代の自殺者も増えているし,不安や鬱の症状も増えている.2012年~2013年ごろから,事態が悪化しはじめている: Source: Twenge (2020)考えうる理由のひとつは,「2011年よりも世の中がずっとひどくなってしまったから」というものだ.テイラー・ローレンツが言うよ

          ノア・スミス「やっぱりもしかしてスマホがわるいのかも」(2023年3月2日)|経済学101
        • WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times

          主な確率分布の関連図 こんにちは、吉岡(@yoshiokatsuneo)です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。 データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。 学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。 今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。 それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。 【目次】 正規分布 対数正規分布 離散一様分布 連続

            WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
          • 統計・機械学習の理論を学ぶ手順 - Qiita

            社内向けに公開している記事「統計・機械学習の理論を学ぶ手順」の一部を公開します。中学数学がわからない状態からスタートして理論に触れるにはどう進めばいいのかを簡潔に書きました。僕が一緒に仕事をしやすい人を作るためのものなので、異論は多くあると思いますがあくまでも一例ですし、社員に強制するものではありません。あと項目の順番は説明のため便宜上こうなっているだけで、必ずしも上から下へ進めというわけでもありません。 (追記)これもあるといいのではないかというお声のあった書籍をいくつか追加しました。 数学 残念ながら、統計モデルを正しく用いようと思うと数学を避けることはできません。ニューラルネットワークのような表現力が高くて色々と勝手にやってくれるような統計モデルでも、何も知らずに使うのは危険です。必ず数学は学んでおきましょう。理想を言えば微分トポロジーや関数解析のような高度な理論を知っておくのがベス

              統計・機械学習の理論を学ぶ手順 - Qiita
            • アルゴリズム・AtCoder のための数学【前編:数学的知識編①】 - Qiita

              こんにちは、大学 1 年生になったばかりの E869120 です。 私は競技プログラミングが趣味で、AtCoder や日本情報オリンピックなどに出場しています。ちなみに、2021 年 4 月 7 日現在、AtCoder では赤(レッドコーダー)です。 本記事では、アルゴリズムの学習や競技プログラミングで使える数学的な部分を総整理し、それらについて解説したいと思います。前編・中編では数学的知識、後編(2021/4/26 公開予定)では数学的考察の側面から書いていきます。 【シリーズ】 アルゴリズム・AtCoder のための数学【前編:数学的知識編①】 ← 本記事 アルゴリズム・AtCoder のための数学【中編:数学的知識編②】 アルゴリズム・AtCoder のための数学【後編:数学的考察編】 1. はじめに 21 世紀も中盤に入り、情報化社会(いわゆる「IT 化」)が急激に進行していく中、

                アルゴリズム・AtCoder のための数学【前編:数学的知識編①】 - Qiita
              • タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita

                この時期だからこそ自学しよう 海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。 これ系のまとめ記事は他にもありますが、 翻訳済の日本の本と、原著を並べて表示していきたいと思います。 特にデータサイエンス分野に限って紹介。 お高いあの名著も実は原著なら無料かも? (2020年5月時点) 続編、データサイエンスの名大学講座 を書きました (2020年8月) 1冊目 邦題 : 統計的学習の基礎(1万5千円) 俗に言う「カステラ本」です。 日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。 内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。 まさに「アルゴリズム・理論の辞書」。 年代的に古い感じはしますが、基礎はいつだって大切です。 数字に強くないと絶対読み切れない。。。 原著 : The Elements of S

                  タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita
                • 統計検定準1級に合格した話 - i5882353iの日記

                  2022年4月13日の試験で統計検定準1級に合格したので、記事を書く気になりました。daminです。(Twitter: @5882353i) うおおおおおおお統計検定準1級合格!!!!!!!うおおおおおおお!!!おおおおおお!!!!!!うおおおおおお!!!!!!!!!!!!!!! pic.twitter.com/J1LDsgUVm1 — 惰眠👻 (@5882353i) 2022年4月13日 背景や、合格するまでに使った本などを書いていきます。 背景(受験までのおおまかな流れなど) 余談:センター統計選択のススメ 持っていた方がよいもの・知識 線形代数の知識 Pythonの知識 goodnotes5 使った本 東大出版の統計学入門(通称:赤い本) 公式の準1級対策本(通称:ワークブック) 過去問 クラインバウム生存時間解析 ゼロDL ベイズ漫画 まとめ 真剣に読んでいる人向けのまとめ あま

                    統計検定準1級に合格した話 - i5882353iの日記
                  • 放送大学マイルストーン('23)|lumpsucker

                    はじめにこの記事は、放送大学の(主に情報コースを中心とする)学生さん向けに、私の履修済み科目の感想と主観的評価を共有して、履修計画の参考にしていただくことを目的に作成しました。下記の記事の通り、2019年-2020年の2年間で情報コースの科目を8割方履修したのでそれなりの網羅性があるかと思います。 (2023年2月追記)その後、選科履修生として履修した他コースの科目や大学院科目などを追加して112科目掲載しています。試験難易度については履修時期によって会場試験・在宅ペーパー試験・在宅Web試験が混在しているので参考程度でお願いします。 タイトルは私が現役生の時に通っていた大学の似たような評価システムから拝借しました。 以下の科目は基本的にナンバリングが低い順に並べています。閉講済みの科目も混じっていますが、記録と後継科目の参考のために残しておきます。あくまで全て(上記の記事にある通り、文系

                      放送大学マイルストーン('23)|lumpsucker
                    • AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告 - GIGAZINE

                      Adobeが権利的にクリアなトレーニングモデルを用いた画像生成AI「Firefly」を発表したり、Microsoftの検索エンジンであるEdgeで対話型AIのChatGPTが活躍していたり、世界的なコンサル企業が「社員の50%は業務にジェネレーティブAIを活用している」と明らかにしたりと、ジェネレーティブAIは社会に広がり続けています。しかし、AIを使用してコンテンツを作成・公開する人が増えていることで、新たな問題として「AIが生成したコンテンツがインターネット上にあふれ、それをAIが学習することで、重大な欠陥が生まれている」ということが研究者グループから指摘されています。 [2305.17493] The Curse of Recursion: Training on Generated Data Makes Models Forget https://doi.org/10.48550/

                        AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告 - GIGAZINE
                      • ぼくは「モンティ・ホール問題」がよくわからない。 - 山形浩生の「経済のトリセツ」

                        10月24日に、Change to Hopeというイベントがあって、スティーブン・ピンカーが来日して基調講演をする……予定だったのがコロナで来れずオンラインになってしまったんだが、ぼくがその司会役、というか質問係をおおせつかったのでした。 www.change-to-hope.com で、これは新著『人はどこまで合理的か』をベースに最近のネタを散りばめる講演で、ぼくも付け焼き刃でざっと読んでみました。基本は、人はいろいろ数学パズルみたいなものにごまかされて合理性を発揮しにくくなる部分があるのだ、という話や経済学的な合理性の話などで、あとは合理性がいかにしてこれまでの人類の発展を率いてきたか、これからも理性をちゃんと使ってがんばらないといけないよ、というもの。一般向けの講義をまとめたものだそうで、人によっては知ってる話ばかりでつまらないかもしれない。まったく知らなかった目新しい話はない。類書

                          ぼくは「モンティ・ホール問題」がよくわからない。 - 山形浩生の「経済のトリセツ」
                        • 新NISAでの個別株投資を考えてみる|UKI

                          はじめにUKIです。 いよいよ来年2024年から新NISAが始まります。今回の記事では、新NISAにおける投資戦略、特に個別株投資の戦略について考えてみます。この時期にこのテーマを取り上げることは、一般層にデータ投資を知ってもらう上で避けて通れないと考えました。 この記事を読んでいらっしゃる方は、「NISAで個別株投資なんかいらんやろ、米株インデックス(もしくはオルカン)でいいやん」と思っていることでしょう。本記事は、そのように投資に対して一定以上のリテラシーをお持ちの方を対象としています。そのような方にこそ、是非ご拝読頂きたいと思っています。 本記事では、まず新NISAの概要をざっくり説明し、続いて新NISAで個別株投資を考えるべき理由について説明します。その後、個別銘柄の選定手法について説明を進めます。今回筆者は、各企業の株価データと財務諸表を元に、どのような個別株が購入検討の余地があ

                            新NISAでの個別株投資を考えてみる|UKI
                          • 統計検定準1級 合格体験記 - Qiita

                            はじめに 統計検定準1級は(一財)統計質保証推進協会が実施、(一社)日本統計学会が公式認定する「2級までの基礎知識をもとに、実社会の様々な問題に対して適切な統計学の諸手法を応用できる能力を問う」試験です。現在はCBTでの実施となっています。 主観を込めて言いますと、2級と準1級では難易度に雲泥の差があります。 強調して言っておきます。まったく違います! 準1級では統計的推定や検定に加えて、多変量解析(重回帰、PCA、主成分分析、数量化)、時系列解析、マルコフ連鎖、確率過程、分散分析、ベイズ統計、MCMC...と範囲が広いのが特徴です。 以下、かなりの長文になりましたが、受験して得た知見をかなり具体的に記述しました。読者の皆様の合格への一助となれば幸いです。 目的 私はとある私立中高で物理と情報を教えています。統計の勉強を始めたのは、教科「情報」を教えるにあたってのスキルアップが目的です。も

                              統計検定準1級 合格体験記 - Qiita
                            • 統計検定1級(2021)を受験した話(統計数理の試験対策・勉強編) - 統計応用合格君’s diary

                              この記事は何? タイトルの通り、2021年の統計検定1級試験を受験し統計数理に合格してきたので、記憶が鮮明なうちに勉強してきた内容をメモしておこうと思います。ちなみに、統計検定は私にとって今回が(級によらず)初めての受験でした。 対策・勉強した内容以外の、当日の受験体験記は以前に公開していますので、そちらもご興味あればぜひ併せてご覧ください。 taro-masuda.hatenablog.com 免責 あくまで個人的な方法論であるため、本記事の情報が必ずしも今後の試験においてそのまま有効であるとは限りませんのでご注意ください。損失等をこうむられた場合であっても、筆者は一切の責任を負いかねます。 TL;DR 久保川先生の教科書『現代数理統計学の基礎』の2~8章の章末問題((*)印は飛ばす) + 統計数理は過去問を仕上げました。過去問は1ヶ月以上前からやるのがお勧めです。 現代数理統計学の基礎

                                統計検定1級(2021)を受験した話(統計数理の試験対策・勉強編) - 統計応用合格君’s diary
                              • 量子力学に「観測問題」は存在しない|Masahiro Hotta

                                前世紀には観測問題を論じる人が多かったのですが、標準的な量子力学にはそのような観測問題はなかったことが現在では分かっております。例えば以下のように理解されています。 (1)波動関数の収縮について: 量子力学は情報理論の一種であり、波動関数は古典力学の粒子のような実在ではなく、情報の集まりに過ぎません。測定によって対象系の知識が増えることで、対象系の物理量の確率分布の集まりである波動関数も更新されるのが波動関数の収縮です。 「系を観測をすると、その波動関数(または状態ベクトル)は収縮し、その変化はシュレディンガー方程式に従わない」と聞いて、前世紀の「観測問題」に目覚めてしまって、「波動関数とは?収縮とは?」と懊悩してしまっている物理学徒は、まず箱の中の古典的なサイコロの目の確率を考察してみて下さい。 各目の出る確率は1/6で、一様分布でしたが、箱をとってサイコロを観測して3の目が出ていれば、

                                  量子力学に「観測問題」は存在しない|Masahiro Hotta
                                • 『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊 - 渋谷駅前で働くデータサイエンティストのブログ

                                  標準 ベイズ統計学 朝倉書店Amazon 発刊当時に話題になっていた『標準ベイズ統計学』。実は訳者のお一人、菅澤翔之助さんからオフィス宛てでご恵贈いただいていたのですが、親父の没後処理やら自分のDVTやら実家の片付けやらで全く手が回らずオフィスに置いたままにしてしまっていたのでした。で、この度改めて拝読してみたら「何故もっと早く読まなかったんだ」と後悔するくらいあまりにも内容が素晴らしかったので、遅まきながら書評記事を書こうと思い立った次第です。 ベイズ統計学というと、殆ど詳しくない人だと「ベイズの定理以外に何があるの?」という印象ぐらいしかないかもしれませんし、一方でとりあえず技法としてやり方だけ覚えてしまった人だと「とりあえずMCMC回せばいいんだよね?」みたいな雑な理解になってしまうかもしれません。いずれにせよこれまで邦書ではベイズ統計学というと超初歩か実装重視かの二択が多かったせい

                                    『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊 - 渋谷駅前で働くデータサイエンティストのブログ
                                  • 『ベイズ深層学習』が最高すぎた - 日常と進捗

                                    今回は書評エントリー。 ちょうど今日の午前中に須山さんの『ベイズ深層学習』を読み終えた。 読了。 控えめに言って、スゴかった。 まじでボリュームたっぷりでものすごく読み応えのあった一冊だったと思う。 ベイズ機械学習に詳しくない人でも読めるし(簡単とは言ってない)ホントに全人類におすすめしたい。 pic.twitter.com/Lbfs6Rr9JM— コミさん (@komi_edtr_1230) January 15, 2020 ものすごく良かったのでここで全力で宣伝しようと思う。 概要 本書はベイズ統計と深層学習の組み合わせについて詳説した一冊で、頻度論に基づく線形回帰と確率分布の基礎の解説から始まり、そこから線形回帰やニューラルネットワークがベイズ的にどのように説明できるかについて展開、そこから深層学習のベイズ的な説明をしてガウス過程へとたどり着く構成となっている。 本書の魅力はなんとい

                                      『ベイズ深層学習』が最高すぎた - 日常と進捗
                                    • 基礎から学ぶ統計学

                                      本章では、二項検定を学びます。二項検定は、本書で学ぶ統計手法の中では、最も使用頻度が低い手法です。しかし、統計学の入門に最適な学習項目です。理由が3つあります。第一に、高校1~2年で学んだ数学だけで、この手法の原理を完全に理解できます。統計手法はたくさんありますが、唯一この手法だけは、全て手作りの計算で実行できます。第二に、面倒な検定統計量の計算を必要としません。第三に、二項検定には、検定の論理の全てが詰まっています。こうした理由から、読者のお父さんやお母さん、もしくは、お爺ちゃんやお婆ちゃんの世代では、二項検定は、高校の数学の教科書で解説されていました。この「とても分かりやすい」という長所を、活用しない手はありません。本書では、統計学の学習を、二項検定から始めます。本章では、当時の大学入試の頻出問題をさらに簡単にした例題を使って、学びます。… 本書の使い方 統計学を学ぶ心がけ/予備知識/

                                        基礎から学ぶ統計学
                                      • 時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ

                                        本記事では、時系列予測に利用できるpythonのライブラリの使い方について説明をします。 パッとライブラリを使うことを目指すため具体的なアルゴリズムの説明は省きます。 ※説明が間違えている場合があればご指摘いただけると助かります。 目次 利用データ ライブラリ Prophet PyFlux Pyro Pytorch Lightgbm 補足:Darts まとめ ソースコード このブログで記載されているソースコードはGitHubに上げておいたのでもしよろしければ参考にしてください。 github.com 利用データ 今回用いるデータはkaggleのM5 Forecasting - Accuracyと呼ばれるコンペティションで利用されたデータを用います。 作成したランダムなデータよりも実データのほうが予測をしている感があるからです。 予測に使うデータはwalmartの売上データです。 下図はその

                                          時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ
                                        • いいね!Hokudai - #122 新型コロナ対策、研究と政策現場での6ヶ月~西浦博教授ロングインタビュー~

                                          #122 新型コロナ対策、研究と政策現場での6ヶ月~西浦博教授ロングインタビュー~ 2020年07月31日 新型コロナウイルスによる感染症COVID-19は今現在も終息することなく、日本だけでもこれまでに約26,000名で感染が確認されています。本学の西浦博さん(医学研究院 教授)は中国で感染症が発生した直後の1月上旬から研究を開始し、厚生労働省のクラスター対策班の一員としても対応にあたりました。 次々と発生する危機的な状況のなかでデータをかき集め、COVID-19の特徴を徐々に明らかにしていく。そしてそれは直ちに国や自治体の政策へ反映されていく。このような科学と政策のあわいにある感染症の数理疫学は、じっくりと取り組む科学研究、純粋で確実な成果を論文で発表する科学研究というイメージからは遠いかもしれません。しかし、応用重視のオペレーション研究と言われるような分野もまた研究の実際の姿です。

                                            いいね!Hokudai - #122 新型コロナ対策、研究と政策現場での6ヶ月~西浦博教授ロングインタビュー~
                                          • 「施策デザインのための機械学習入門」を完全に理解したサトシくんがポケモン捕獲アルゴリズムを実装する話 - kanayamaのブログ

                                            プロローグ ストーリー編 第1章 感銘 step1. KPIの設定 step2. データの観測構造をモデル化する step3. 解くべき問題を特定する step4. 観測データのみを用いて問題を解く方法を考える step5. 機械学習モデルを学習する step6. 施策を導入する 第2章 絶望 第3章 反省 第4章 再起 step1(再) KPIの設定 step2(再) データの観測構造をモデル化する step3(再) 解くべき問題を特定する step4(再) 観測データのみを用いて問題を解く方法を考える step5(再) 機械学習モデルを学習する step6(再) 施策を導入する 第5章 俺たちの戦いはこれからだ! 実装編 準備 擬似データの生成 意思決定モデルの学習 モデルのオフ方策評価 モデルの真の性能の評価 まとめ この記事を読んだ方はこんな記事も読んでいます(多分) @tkana

                                              「施策デザインのための機械学習入門」を完全に理解したサトシくんがポケモン捕獲アルゴリズムを実装する話 - kanayamaのブログ
                                            • Stable Diffusion の仕組みを理解する - ABEJA Tech Blog

                                              この記事は、ABEJAアドベントカレンダー2022 の 19 日目の記事です。 こんにちは!株式会社 ABEJA で ABEJA Platform 開発を行っている坂井です。 世間では Diffusion Model 使った AI による画像生成が流行っているみたいですね。 自分は元々 Computer Vision 系の機械学習エンジニアだったんですが、この1年くらいは AI モデル開発ではなくもっぱらバックエンド開発メインでやっていて完全に乗り遅れた感あるので、この機会に有名な Diffusion Model の1つである Stable Diffusion v1 について調べてみました!*1 では早速本題に入りたいと思います! Stable Diffusion v1 とは? Denoising Diffusion Probabilistic Model(DDPM) 学習時の動作 for

                                                Stable Diffusion の仕組みを理解する - ABEJA Tech Blog
                                              • 2010年代、物理学を永遠に変えた出来事まとめ

                                                2010年代、物理学を永遠に変えた出来事まとめ2019.11.25 22:00122,609 Ryan F. Mandelbaum - Gizmodo US [原文] ( satomi ) ターニングポイントが一度に訪れた10年。 2010年代は宇宙、物理の考え方が根底から変わる「パラダイムシフトの通過点」だったと、スタンフォード大学のNatalia Toro素粒子物理学・天体物理学准教授は語り、「行く末はわからないけど、50年後に振り返って、あれが幕開けだったと思うかもしれない」と言っています。 10年の主な出来事を振り返ってみましょう。 神の素粒子2010年代はマクロもミクロも研究が大きく進化した10年でした。中でも大きかったのは、スイスのジュネーブにある全長約27kmの大型ハドロン衝突型加速器(LHC)で見つかったヒッグス粒子発見のニュースです。素粒子物理学の理論的枠組み「標準模型」

                                                  2010年代、物理学を永遠に変えた出来事まとめ
                                                • 「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary

                                                  この文章は pandoc-hateblo で tex ファイルから変換しています. PDF 版はこちら 2021/10/15 追記: 後半のベイジアンブートストラップに関する解説はこちらのほうがおそらく正確です ill-identified.hatenablog.com 概要挑発的なタイトルに見えるかも知れないが, 私はしらふだしこれから始めるのは真面目な話だ — 正直に言えばSEOとか気にしてもっと挑発的なタイトルにしようかなどと迷ったりはしたが. 「全数調査できれば標本抽出の誤差はなくなるのだから, 仮説検定は不要だ」という主張を見かけた. いろいろと調べた結果, この問題を厳密に説明しようとすると最近の教科書には載ってない話題や視点が必要なことが分かった. ネット上でも勘違いしている or よく分かってなさそうな人をこれまで何度か見かけたので, これを機に当初の質問の回答のみならず関

                                                    「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary
                                                  • 統計学を哲学する « 名古屋大学出版会

                                                    内 容 統計学は実験や臨床試験、社会調査だけでなく、ビッグデータ分析やAI開発でも不可欠である。ではなぜ統計は科学的な根拠になるのか? 帰納推論や因果推論の背後に存在する枠組みを浮き彫りにし、科学的認識論としてデータサイエンスを捉え直す。科学と哲学を架橋する待望の書。 【ALL REVIEWS】序章(抜粋) 目 次 序 章 統計学を哲学する? 1 本書のねらい 2 本書の構成 第1章 現代統計学のパラダイム 1 記述統計 1-1 統計量 1-2 「思考の経済」としての記述統計 1-3 経験主義、実証主義と帰納の問題 2 推測統計 2-1 確率モデル 2-2 確率変数と確率分布 2-3 統計モデル 2-4 推測統計の世界観と「確率種」 第2章 ベイズ統計 1 ベイズ統計の意味論 2 ベイズ推定 2-1 仮説の確証と反証 2-2 パラメータ推定 2-3 予測 3 ベイズ統計の哲学的側面 3-1

                                                    • 『わけがわかる機械学習』中谷秀洋(著)の書評 - StatModeling Memorandum

                                                      僕が中谷さんと初めて会ったのはみどりぼんの読書会で、初めて話したのは岩波DSの打ち合わせだったと思います。今でもそんなに親しくはないと思います。しかし、中谷さんのブログは10年ぐらい前から読んでいました。自然言語処理を中心とする機械学習に関連する理論(の解釈)・論文レビュー・数値実験の記事が多く、他のブログでは見られない独特かつ理解の深い内容で、毎日勉強させてもらっていました。今でも何度も読むべきブログです。その中谷さんが機械学習についてまるごと一冊書いたものが本書になります。もともと買うつもりでしたが、献本いただいたので簡単にご紹介いたします。 わけがわかる機械学習 ── 現実の問題を解くために、しくみを理解する 作者: 中谷秀洋出版社/メーカー: 技術評論社発売日: 2019/08/28メディア: 単行本(ソフトカバー)この商品を含むブログを見る 目次は以下になります。 0章: はじめ

                                                        『わけがわかる機械学習』中谷秀洋(著)の書評 - StatModeling Memorandum
                                                      • 輸送問題を近似的に行列計算で解く(機械学習への応用つき) - 私と理論

                                                        輸送問題と呼ばれる問題があります. この問題は,普通は線形計画法やフローのアルゴリズムを使って解かれます. この記事では,この輸送問題を近似的に行列計算で解くアルゴリズム(エントロピー正則化 + Sinkhorn-Knopp アルゴリズム)を紹介します. 輸送問題とは アルゴリズム 得られる解の例 なぜこれで解けるのか? 競プロの問題を解いてみる 機械学習界隈における流行 まとめ 輸送問題とは 輸送問題とは以下のような問題です. 件の工場と 件の店舗からなる,ある商品の流通圏があるとする. 各工場には 個の在庫がある.. 各店舗では 個の需要がある. 在庫の総和と需要の総和は等しいとする (すなわち ). 工場 から店舗 に商品を一つ運ぶためには の輸送コストがかかる. 各工場 から各店舗 への輸送量 を適切に決めて,各店舗の需要を満たしつつ輸送コストの総和を最小化せよ. 輸送問題は最適化

                                                        • 見積りとは何か?

                                                          見積りとは何か?2023年12月2日この記事は 10X アドベントカレンダー2023 という企画の2日目(12/2)の記事です。 1日目(12/1)の昨日は岡野さん(@operandoOS)による「CIを高速化する技術⚡️」でした。 はじめに この記事の内容は以下の本の第一章とほぼ同じ内容となります。この記事の読んで見積りについて興味が湧いたらぜひ以下の書籍に目を通してみてください。 出典 ソフトウェア見積り 人月の暗黙知を解き明かす 早速ですが見積りしてますか?おそらくソフトウェアエンジニアの方であれば、こんな感じで会話して見積りした経験が1度はあるんじゃないでしょうか? プロダクトマネージャー「機能xyzの件だけど、開発期間はどのくらいだと見積もってる?」 ソフトウェアエンジニア「1ヶ月ですね。」 プロダクトマネージャー「長すぎる。1週間で何とかならないか。」 ソフトウェアエンジニア「

                                                            見積りとは何か?
                                                          • Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース

                                                            ※夏のビッグセール、およびキャンペーンは終了しました。ご応募ありがとうございました。なお、Udemyの講座修了者を対象とした「学習応援キャンペーン」は9月30日まで実施中です。 オンライン学習プラットフォーム「Udemy」では、2023年8月22日(火)から夏のビッグセールを開催します。対象の講座が1,200円から購入可能と、なかなかチャレンジできなかった新しい領域を学習するにはとってもお得なチャンス。 今回のセール対象講座から、ChatGPTやMidjourneyといった話題の生成系AI、その基礎となる大規模言語モデル(LLM)の入門や実装を扱う講座といった人気のトピックに加えて、アプリケーション開発やプロジェクトマネジメント、さらには英語学習など、ステップアップを目指すITエンジニアにオススメの中級から上級の講座もピックアップして紹介します。 Udemyで勉強を始めたいけれど、いろいろ

                                                              Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース
                                                            • ベイズ統計学を勉強する参考書のフロー - Qiita

                                                              慶應義塾大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます. 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが,今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て,比較的最近の書籍や英語の書籍まで含めて紹介していきます. まずは全体的なフローのイメージを提示しておきます. 今回の記事では,「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます. (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め,自力でモデルを組んだり実装することができる また,このゴールへの道のりとして,大きく2通りのルートを想定します. (ルートA: フルスクラ

                                                                ベイズ統計学を勉強する参考書のフロー - Qiita
                                                              • シャノン限界を達成しかつ実行可能な通信路符号を実現

                                                                (報道発表資料) 2019年5月27日 日本電信電話株式会社 シャノン限界を達成しかつ実行可能な通信路符号を実現 ~効率の良い光通信や無線通信が可能に~ 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:澤田純、以下 NTT)は、シャノン限界を達成しかつ実行可能な通信路符号 (誤り訂正符号)「CoCONuTS※1」を実現しました。 本技術は、計算機科学者シャノンによって求められた、通信効率の限界(シャノン限界※2)を達成する誤り訂正符号を実現する技術です。一つの通信路が与えられた時、そのシャノン限界を達成するためには、一般には膨大な計算量が必要だと考えられていました。一方で、実用的な実装方法でシャノン限界を達成できる符号が知られていましたが、これらの符号がシャノン限界を達成するのは特殊な通信路に限られていました。 本技術により任意の通信路でシャノン限界を達成する通信路符号を構成で

                                                                  シャノン限界を達成しかつ実行可能な通信路符号を実現
                                                                • 敵対的プロンプト技術まとめ - Qiita

                                                                  こんにちは@fuyu_quantです。 この記事はLLM Advent Calender 2023 17日目の記事です。 よかったらプライベートで作成したData Science wikiのGPTsも見て下さい! はじめに 今回は敵対的なプロンプト技術についてまとめました.まとめ方は主に,Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs through a Global Scale Prompt Hacking Competition というLLMに対する敵対的なプロンプト技術に関してまとめた論文を参考にしています.本記事の内容が世の中のLLMを使ったサービスの機能向上の役に立てれば幸いです. ※世の中のLLMサービスが敵対的なプロンプト手法に対応できるように公開をしたものであり,利用を

                                                                    敵対的プロンプト技術まとめ - Qiita
                                                                  • イチローの安打数がポアソン分布にならず正規分布になる理由を考察してみた | ロジギーク

                                                                    滅多に起こらない現象を表すポアソン分布はイチローの安打数にも当てはまるのか? 1994年、プロ3年目のイチローはシーズン210安打、打率.385を記録して、一気にスーパースターになりました。 この年の打率10傑は次の通りです。 (年度別成績 1994年パシフィックリーグ|NPB.JP 日本野球機構 より抜粋) 1位と2位以下の差が凄いですね。 いかにイチローが図抜けていたかが分かります。 今年のパ・リーグの規定打席以上の打者29人の安打数を見ると、試合数より少なくなっていて安打数÷試合数=0.93です。 これくらいだと、1試合当たりの安打数は「滅多に起こらない事象の確率分布」であるポアソン分布に従います。 しかし、普通でない打者のイチローは、1試合当たり1.6本以上の安打を打っています。 そのような場合もポアソン分布に従うのでしょうか? それを調べてみました。 比較対象として1994年打率

                                                                      イチローの安打数がポアソン分布にならず正規分布になる理由を考察してみた | ロジギーク
                                                                    • 披露宴の席次を Gromov-Wasserstein 最適輸送で決めた話

                                                                      数理最適化 Advent Calendar 2022の9日目です。 新緑の頃、新型コロナ流行の合間をぬって、ささやかな結婚披露宴を表参道の式場にて催しました。諸々の準備の中でも席次はこだわるとキリがなく、数理最適化を使って決めました。人間関係をできるだけ保つようなゲスト集合から座席集合への写像を考えます。 ゲスト間人間関係を考慮して良い感じの配席を考えたい tl;dr 披露宴をしました 知り合い関係が複雑かつ長机でゲストの席配置が難しい 組合せ爆発は本物。高々20人の配置に1週間以上悩んだ結果、数理最適化した方が早いと結論 「知り合い同士を近くに配席する」問題は非凸な二次計画になり汎用ソルバでうまく解けない ゲストを席に"輸送"すると考えて最適輸送の一種で解くとうまくいった 本質的に非凸な問題を非凸のまま、しかし性質の良い距離構造を活用するアプローチが奏功したのではないか 再現用Colab

                                                                        披露宴の席次を Gromov-Wasserstein 最適輸送で決めた話
                                                                      • OpenAI開発のテキスト生成AI「GPT-3」がどんな処理を行っているのかを専門家が解説

                                                                        AI研究団体・OpenAIが発表して話題を呼んだ対話型AI「ChatGPT」は、テキスト自動生成AI・GPT-3の派生形である「GPT-3.5」をファインチューニングした自然言語処理モデルです。チューリッヒ工科大学で機械学習とロボティクスの博士号課程に進んでいるダニエル・デュガス氏が、GPT-3が行っている数学的処理工程について解説しています。 The GPT-3 Architecture, on a Napkin https://dugas.ch/artificial_curiosity/GPT_architecture.html ◆入力/出力 まずGPTの「入力」とは一連のN個の単語のことで、「(入力)トークン」とも呼ばれます。そして、GPTの「出力」とは、入力トークンの最後に配置される可能性が最も高いと推測される単語です。例えば「not all heroes wear(すべてのヒーロ

                                                                          OpenAI開発のテキスト生成AI「GPT-3」がどんな処理を行っているのかを専門家が解説
                                                                        • 教師あり学習の精度を超えた!?相互情報量の最大化による教師なし学習手法IICの登場!

                                                                          3つの要点 ✔️相互情報量を最大化する枠組みでニューラルネットを学習する教師なし学習手法IICの提案 ✔️予測値をそのまま出力するニューラルネットを学習可能であるため、クラスタリングが不要 ✔️従来の教師なし学習手法の「クラスタが一つにまとまってしまう問題」および「ノイズに弱いという問題」を解決 Invariant Information Clustering for Unsupervised Image Classification and Segmentation written by Xu Ji et.al (Submitted on 22 Aug 2019) subjects : Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG) はじめに 近年、様々な場面において、深層学習手法が使用さ

                                                                            教師あり学習の精度を超えた!?相互情報量の最大化による教師なし学習手法IICの登場!
                                                                          • [確率思考の戦略論] 1.確率理論の導入とプレファレンスの数学的説明

                                                                            import numpy as np import scipy from scipy.stats import binom %matplotlib inline %config InlineBackend.figure_format = 'svg' import matplotlib import matplotlib.pyplot as plt import seaborn as sns print("numpy version :", np.__version__) print("matplotlib version :", matplotlib.__version__) print("sns version :",sns.__version__) numpy version : 1.18.1 matplotlib version : 2.2.2 sns version : 0.8.1

                                                                              [確率思考の戦略論] 1.確率理論の導入とプレファレンスの数学的説明
                                                                            • 『ウェブ最適化ではじめる機械学習』はモダンなUI/UX改善の枠組みを学ぶ上で至適の一冊 - 渋谷駅前で働くデータサイエンティストのブログ

                                                                              ウェブ最適化ではじめる機械学習 ―A/Bテスト、メタヒューリスティクス、バンディットアルゴリズムからベイズ最適化まで 作者:飯塚 修平発売日: 2020/11/19メディア: 単行本(ソフトカバー) こちらの書籍を著者の飯塚修平さんからご恵贈いただきました*1。テーマとしてはウェブ最適化即ちいわゆるUI/UX改善で、そのアプローチについて包括的にまとめた内容です。ちなみに本書は著者ご自身の修士・博士論文の内容に沿ったもので、いわば大学院での研究の集大成とも言えるものなのだそうです。 と書くと、いかにも「ガッチガチの研究」本に見えるかもしれませんが、引用されている事例などには一般のユーザー・消費者でもある我々にも馴染み深いものが多く、意外と取っ付きやすい内容だなと個人的には感じました。また、A/Bテスト・バンディット・ベイズ最適化とそれぞれ個別に専門書が書かれることが多く、別々に学ぶ羽目にな

                                                                                『ウェブ最適化ではじめる機械学習』はモダンなUI/UX改善の枠組みを学ぶ上で至適の一冊 - 渋谷駅前で働くデータサイエンティストのブログ
                                                                              • 強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

                                                                                はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に はじめに 強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は意外と多いのではないかと思われます。これを知っていようが知っていまいが、正直世の中の便利なフレームワークを活用すれば強化学習を実行することは可能であるためだと推測されます。 しかし、ある種の出発点になっているはずの基礎方程式を無視して、ガチャガチャ色々試してみても、なんだかフワついたままでモヤモヤしてしまうのではないでしょうか。少なくとも自分はそうです。 なので今回はベルマン方程式を基本から丁寧に解説していきたいと思います。 ベルマン方程式の概要 細かい話をする前に、ベルマン方程式がど

                                                                                  強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS
                                                                                • 【深津式プロンプト】「ChatGPTに役割を与える」活用例と使い方 | マーケターが知っておきたい生成AI

                                                                                  2022年11月末のリリース以降、1週間未満でユーザー数が100万人を突破するなど、大きな注目を浴びるChatGPT。マイクロソフトが検索エンジンBingとChatGPTを融合した、新しい検索機能を発表したことでも話題を呼んでいる。 そんなChatGPTにいち早く注目し、さまざまな活用方法を考案しているのがnote株式会社 CXOの深津貴之氏だ。同氏は2月9日(木)、「あなたの仕事が劇的に変わる!? チャットAI使いこなし最前線」と題したイベントに登壇し、豊富な具体例とともに仕事でも役立つChatGPT活用術を公開した。 本レポートではChatGPT初心者に向けた基礎知識を整理したうえで、“深津式”ChatGPT活用術を紹介していく。 ChatGPTとは? 何がスゴイ?ChatGPTとは、OpenAI社が開発した自然言語処理のAIモデル「GPT」を搭載した、対話型のAIチャットツールのこと

                                                                                    【深津式プロンプト】「ChatGPTに役割を与える」活用例と使い方 | マーケターが知っておきたい生成AI