タグ

webとデータに関するdeejayrokaのブックマーク (4)

  • プロでもよくある線形回帰モデルの間違い - Qiita

    最近、データサイエンスが流行っていることもあり、線形回帰モデルについても解説記事を見かけることが多くなりました。情報にアクセスしやすくなったのはいいことだと思うんですが、ずっと以前から間違いや解説の不足が多い理論なので、私なりに解説を試みたいと思います。全体的にあまり厳密ではありませんが、線形回帰モデルを学びたての方には有益な記事になるかなと思います。 あと、私も勉強中の身なので、間違いがあったらご指摘いただけたら嬉しいです。 題 さて、よくある間違いとは以下のような解説です。 線形性の仮定が満たされていないので、線形回帰モデルを使ってはいけない 残差が正規分布&等分散ではないので、線形回帰モデルを使ってはいけない 回帰係数に対するt検定の結果をもとに、p値が大きい説明変数を除外する 多重共線性があるとよくないので、変数間で相関が強い、もしくはVIF値が大きい変数を除外する AICが小さ

    プロでもよくある線形回帰モデルの間違い - Qiita
    deejayroka
    deejayroka 2023/01/10
    "「多重共線性 = 悪いもの」と捉え、考えなしに変数を除外するのは間違いです。交絡因子として必要なのかどうか、背後の関係を考えて慎重に意思決定する必要があります"
  • デジタルツイン指向の自動運転シミュレーター、ティアフォーがオープンソース公開

    ティアフォーは11月28日、安全な自動運転システムを効率的に開発することを目的としたデジタルツイン指向の自動運転シミュレーター(Scene Simulator for Autoware - AWSIM)をオープンソースで公開した。 自動運転シミュレーターは、自動運転ソフトウェアの評価・検証を実現するために、3次元モデル地図をベースに仮想世界を構築し、リアルな物理モデルを用いたセンサーデータモデルと組み合わせることで、現実世界の運転および交通環境をシミュレーションする。また、今後、機械学習向けに学習用合成データを自動生成することで、機械学習を活用した物体検出や環境認識の学習および検証コストを大幅に低減できるようになるという。 同社のWeb.Autoは、自動運転シミュレーション、CI/CDデータパイプライン、データ管理、運行管理、遠隔監視を実現するクラウドネイティブかつエッジ集約型のDevOp

    デジタルツイン指向の自動運転シミュレーター、ティアフォーがオープンソース公開
  • Python本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで - Lean Baseball

    毎年恒例、Pythonと学び方のまとめ・2019年バージョンとなります. ※2021/1/11更新:2021年版あります ※2020/1/9更新:2020年版もあります, こちらもよろしくおねがいします! ※ちなみに昨年版はこちら 改めましてこんにちは、Pythonと野球を仕事にしています、@shinyorke(Python歴おおよそ8年)ともうします. なお、Python その2 Advent Calendar 2018 12/24記事でもあります. このエントリーはそこそこ長いので、「最初の方をサクッと読んで、残りはつまみ読み」してもらえると良いかもです!*1 ※もちろん全部読んでも構いません!(それはそれで嬉しい) サクッとまとめると 入り口としての「独学プログラマー」は万人が読んだほうが良い名著 データ分析・解析やりたい人も、Webからやっておくと良いかも(特に前処理) Web

    Python本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで - Lean Baseball
  • 機械学習を学ぶ上で個人的に最強と思う教科書 - Qiita

    動機 いわずもがなですが、機械学習の勉強にはとても時間が掛かります。 でも、同じ勉強時間を費やしたとしても、教材の良し悪しで捗り方が大きく変わってくることは、誰もが実感していることだと思います。 そこで、記事ではテーマごとに私が考える最強の教科書をリストしていこうと思います。 ディープラーニング(アルゴリズムの理解) 「Deep Learning」An MIT Press book, 2016/12 発行 http://www.deeplearningbook.org/ 印刷も売られてますが、上のWebページでいつでもタダで読めます。(版権上の問題でPDFの形では配布できない&してないそうです) このは、ここ数年のディープラーニングの進歩のうち研究者の間ではメジャーとなっているであろうテーマはすべて書いてある、ともいえる内容の広さがありつつ、それぞれのテーマについて理論的背景と具体的

    機械学習を学ぶ上で個人的に最強と思う教科書 - Qiita
  • 1