    昨日のエントリで「これまで長年使われてきた検定がそれほど間違っているはずはない」というノアピニオン氏の意見を紹介したが、それに対してコメンターの一人が、以下のエピソードを紹介している。 I first presented this result to a recent convention of reliability and quality control statisticians working in the computer and aerospace industries; and at this point the meeting was thrown into an uproar, about a dozen people trying to shout me down at once. They told me, "This is complete nonsense. A

    についてノアピニオン氏が書いている。p値叩きは一部の心理学の学術誌が有意性検定を禁止するところまで行ったが、こうした動きは行き過ぎであり、これまで長年使われてきた検定がそれほど間違っているはずはない、とノアピニオン氏は言う。以下は氏がそう考える理由。 p値叩きで槍玉に挙げられている、研究者が自分の望むp値を得るまで手を変え品を変え分析を繰り返すこと(p-hacking)や、対立仮説を適切に設定しないことによる偽陽性の問題は、再現性の追究という科学の通常の慣行で解決できる。 有意性検定だけを見るのではなく、効果量や適合度検定を見るようにすべき。p値だけで結果の有用性を判断する人がいるにしても、それは彼らがp値の使い方を間違えているだけであり、p値が悪しきツールというわけではない。 データ分析では万能のツールは存在しない。 またノアピニオン氏は、p値叩きへの反動の例として、p-hackingの

    データマイニングは、最も当てはまりの良い回帰式を恣意的に拾い上げる慣行につながるという点で経済学では評判が悪いが、正しく使えば有用、とオックスフォード大の2人の研究者(Jennifer L. Castle、David F. Hendry)がこちらのvoxeu記事に書いている(H/T Economist's View)*1。 記事ではまず、最も単純なデータマイニング手法として、有意性の高い順に説明変数を一つずつ追加していく、という手法を挙げている。そうした1-step forward search algorithmsと呼ばれる手法は、非有意になった変数の除去と組み合わせたり(=段階的回帰[stepwise regression];別名unwise regression)、推計された係数の大きさに制約を掛けたり(=Lasso)、といったバリエーションがあるが、経済学ではまず上手く行かない、と

    引き続き、ギーゲレンツァーのインタビューからの引用。 Gut feelings are tools for an uncertain world. They’re not caprice. They are not a sixth sense or God’s voice. They are based on lots of experience, an unconscious form of intelligence. I’ve worked with large companies and asked decision makers how often they base an important professional decision on that gut feeling. In the companies I’ve worked with, which are large i

    Dave Gilesが、M. J. Bayarri(バレンシア大)とJ. O. Berger(デューク大)の「The Interplay of Bayesian and Frequentist Analysis」という2004年の論文を紹介している。 以下はその要旨。 Statistics has struggled for nearly a century over the issue of whether the Bayesian or frequentist paradigm is superior. This debate is far from over and, indeed, should continue, since there are fundamental philosophical and pedagogical issues at stake. At the me

