プログラミングと数学に関するwalkaloneのブックマーク (5)

  • 2023年版データ分析の100冊 - Qiita

    データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析機械学習関連のがご好評いただいてましたが古くなりごちゃごちゃしているので新たに作り直しました 記事のめあて IT系の技術者の方がデータ分析関連の仕事をするために役立つを紹介する(私が学び始めた時にあれば欣喜雀躍したであろう)記事として書いております。 記事作者の青木はバイオインフォマティクス(ゲノムデータのDB化中心・PerlMySQL)からRで時系列分析→Pythonデータ分析一般と業務をしてまいりました。 ですので研究者目的のはありません。また、データ分析の基礎は主にRで学んだのですが、昨今の流行に合わせてPythonを中心に、Rのは参考程度にしています(記事のR版のご要望があれば爆裂書きます!) こういうリストをあげる奴は大抵読んでいない、と過去にも言われたのですが、ほとんど読ん

    2023年版データ分析の100冊 - Qiita
  • 歪度と尖度について解説!定義と目安について分かりやすく!|スタビジ

    当サイト【スタビジ】の記事では、尖度と歪度について解説してきます。尖度とは「分布が正規分布からどれだけ尖っているか表す指標」、歪度は「分布が正規分布からどれだけ歪んでいるか表す指標」と定義されています。歪度と尖度を求めることで、データの分布がどのような形状になっているかある程度分かるようになります。今回は歪度と尖度の定義と目安について解説していきます。 こんにちは! データサイエンティストのウマたん(@statistics1012)です! 今回は歪度と尖度について解説していきます! 歪度は「分布が正規分布からどれだけ歪んでいるか表す指標」、尖度は「分布が正規分布からどれだけ尖っているか表す指標」と定義されています。 歪度と尖度を求めることで,データの分布が正規分布に近いものであるか確認することができ,分布の形もある程度推測することが可能になります。

    歪度と尖度について解説!定義と目安について分かりやすく!|スタビジ
  • ChatGPT(GPT-3) 後の進化の予想:自然言語が原始言語と呼ばれる日

    「meaning of meaning」 でMidjourneyにて生成目次: (0) 最尤推定・パラメーター推定 (1) 深層学習とKL情報量について (2) スクリプト意味論について (3) チョムスキー階層と複雑性クラスについて (4) ヴィトゲンシュタイン前期後期による言語哲学の分類について (5) 自然言語が原始言語と呼ばれるまで ※数式が面倒な人は(1)の途中の”中国語の部屋”の部分から読んでください。 GPT-3 Chatはチューリングテストをクリアしているとも言える会話のクオリティを幅広いトピックで行うことができます。これには驚きを隠せません。今後GPT-3以上の自然言語処理ができるために、あるいはこれからの方向を理解するためには何を基準に考えればいいでしょうか?この議論は自然言語処理、統計、言語哲学、オートマトンの基礎的知識のみに基づいて話をしていきます。 結論としてはC

    ChatGPT(GPT-3) 後の進化の予想:自然言語が原始言語と呼ばれる日
  • 1. Pythonで学ぶ統計学 2. 確率分布[scipy.stats徹底理解] - Qiita

    データから計算される確率分布のことを「経験分布」といいます。これに対して、確率分布を生成してくれる関数は「理論分布」といいます。 まず、分布の形(確率分布の種類)を決める、それから母数(確率分布のパラメータ)を決めてしまえば、母集団分布の推定ができます。 そうした統計関数を集めたモジュールがscipy.statsです。その基的な使い方は、次のように記法が統一されています。 ⑴ 確率分布の種類 確率関数は「離散型」と「連続型」の2つに大別されます。 離散型は、例えばサイコロの目のようにとびとびの値をとる変数です。また連続型は、重量や温度のように連続した値をとるものをいいます。 以下に、scipy.statsに実装されている確率分布から、知っておきたい15種類を列挙しました。 確率分布 probability distribution メソッド データ

    1. Pythonで学ぶ統計学 2. 確率分布[scipy.stats徹底理解] - Qiita
  • Interpretable Machine Learning

    Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約 機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。 しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。 書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。 解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。 その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo

    walkalone
    walkalone 2022/04/13
    理解可能な機械学習 教則本
  • 1