エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ポアソン回帰でのカウントデータとは
文章の文字数と誤字数のデータがあり、この関係を調べたく思います。 いろいろな文字数の文章があって、... 文章の文字数と誤字数のデータがあり、この関係を調べたく思います。 いろいろな文字数の文章があって、それぞれにおいて数個程度の誤字数といった感じです。 単純に線形回帰(説明変数:文字数、目的変数:誤字数)をしてみると、直観に反せずそれなりの相関がありました。 ここで線形回帰以外のあてはめの可能性を考えてみることにします。 例えばカウントデータ→ポアソンとよく聞くなということで。 (質問1)しかしポアソン分布に適用するのは基本的に「単位時間当たり」のイベント数と言った単位XX当たりのデータであっているでしょうか。 つまり今回の誤字数はカウントデータではあるけれど、ポアソンでのカウントデータに対応するのは、この場合はむしろ100文字当たりの誤字数になるでしょうか。 誤字数のヒストグラムとしては、下記リンク先の3. 分析の準備 に掲載されている形状にほぼ同じなのですが、 https://touke