[ad#ad4]
論文を読んだりしているとほぼ必ず出てくるといってもいいp値。
でも、p値とはなんぞやってありますよね。
有意差あるってどういう意味?
そもそもp値ってなんの指標なのか?
pってだいたい何よ?
どういったピットフォールがあるか?そんなこともわからずにEBMもなにもないよなぁ。。。
もちろん自分に言い聞かせてます😓
— SGM@理学療法士×反緊縮&変態 (@SGM31214252) November 11, 2019
今回、p値について調べてみました。自分と同じようにp値ってなんなの? っていう人の理解にすこしでも寄与できたらと思います。
[ad#ad5]
◆p値とは~定義・危険率・有意差~
まずは、成書の説明を見てみましょう(『わかりやすいEBNと栄養疫学』より)。
医療分野では、5%を偶然性の有無を判断する基準と考えることが多い。これを有意水準(significance level)と呼ぶ。つまり、偶然に起こる確率が5%未満であれば(危険率5%未満で)、調査法が誤っている可能性も含め、何らかの必然性がある結果と考え、これを有意(significant)と呼ぶ(p<0.05)。
逆に、偶然に起こる確率が5%以上の場合は偶然であると考え、有意でない(not significant)と呼ぶ。さらに、得られた結果が偶然に起こる確率が1%未満(p<0.01)、0.1%未満(0.001)と小さくなるにしたがって、何らかの必然である確率は高くなると考える。このように有意か否かを調べる検定を有意性検定(significance test)と呼ぶ。
なお、偶然に起こる確率のことをp‐値と呼び、上記のように、「p<0.05」、「p<0.01」、「p<0.001」と書くことが多い。-わかりやすいEBNと栄養疫学 P93-
非常に端的にまとまっています。これを読んで「フムフム」とわかるくらいの知識がある人は、この先は読まなくても大丈夫です笑
ちょっと難しいなという人だけ読みすすめてください。
たとえの話。腰痛に効くというAという療法(ストレッチなど)があったとしましょう。
療法Aを実施すると、痛みが10減りました。
本当に効果があるのかもしれません(確実性・必然性)。しかし、たまたま療法Aがよく効いたのかもしれないし、ほかの要因が関わっていたのかもしれません。このたまたまというのを「偶然性」と呼びましょう。
データを評価(検定)して、偶然なのか必然なのかを確率としてはじき出したのがp値(p-value)です(p値のpというのはprobabilityのこと。「ありそうなこと、起こりそうなこと、見込み、公算、ありそうな事柄、確率、確率論、蓋然性」などの意味がある)。
p値は危険率ともいいますが、「(ほかの治療などと比較して)療法Aはなにか違いがあるかも」という予想がウソ(信じるのが危険)かもしれないという可能性を示しています。
その言葉のとおりに、ウソを信じてしまう危険の確率を表しているということです。
療法Aは腰痛に効くという結果という仮説があるとして、p値が低ければウソ(≒偶然)の可能性は低くなり、高ければウソ(≒偶然)の可能性が高くなるということです。
資料(1)を参考に作成
よく論文で見かけるp<0.05(5%)というのは、偶然である確率が5%未満で、その違いは「偶然」ではなく「必然・確実」だろうということで、これを有意差があると表現します。
◆p値と0.05について
なぜ0.05なの? と疑問に思う人もいるでしょう。
『ダメな統計学』には以下のように書かれています。
0.05が選ばれることに、論理的にあるいは統計学的に特別な理由があるわけではない。しかし、0.05というのは科学における慣習として長い間一般に使われてきた。-ダメな統計学 P9-
つまり、なんとなくです笑
世のなかには偶然性(不確実性)というものがありますから、確実に100%の推定は現実的には難しい。そこで、5%くらいの誤差はしょうがないよねというコンセンサス(専門家の決めごと)があるわけですね。
さきほどの療法Aでいえば、100回介入して鎮痛効果(痛みが10減る)が出ないのが5回未満であれば、OKということです。
◆p値の注意点・誤解
p値についての注意点・誤解について見ていきます。
1.誤)p≧0.05(5%以上)は「有意差がない」
p値が5%以上(p≧0.05)ということは、偶然性の影響の可能性を無視できない、つまり、出てきた結果は偶然かもしれないということを表しています。
「有意差がない」ではなく、「有意差があるとはいえない」というのが適切でしょう。日本語(統計)って難しいですね笑
2.誤)p値が大きいと臨床的に効果がない(有意差=有意義差)
『ダメな統計学』には、以下のように書かれています。
p値というのは正しさを測定するものでもなければ、違いがどれだけ重大かを測定するものでもないということを忘れないようにしよう。むしろ、p値は驚きを測定するものであると考えよう。-ダメな統計学 P9-
有意差がないから臨床でも効果がないと考えるのは、拡大解釈といえるでしょう。有意差(これ違いがないぜ!)と有意義差(これ効果ないぜ!)は、似ているようで別物ということです。
このような記事(『「“統計的に有意差なし”もうやめませんか」 Natureに科学者800人超が署名して投稿』)もあります。
「統計的有意差がある=薬効がある」なら「統計的有意差がない=薬効がない」と考えてしまいそうだが、声明ではこのように有意差がない場合、「“差がない”あるいは“関係がない”といった結論をしてはいけない」としている。(中略)
問題はP値が有意水準より大きい場合だ。この場合、帰無仮説を棄却できないが、帰無仮説が正しいことも示していない。結果、「2群に有意差があるとはいえない」というあいまいな表現になる。しかし、声明では「有意差がない=効果がない」と間違った推論をする論文も少なくないと指摘。実際に調べたところ、5つの論文誌・791文献のうち51%に誤りがみられたという。
専門家でも間違えてしまうくらい、ややこしい問題みたいです笑
以上、p値について簡単にまとめてみました。
【資料】
(1)スッキリわかる!臨床統計 はじめの一歩 改訂版、能登洋、羊土社、2018
(2)わかりやすい EBNと栄養疫学、佐々木敏、同文書院、2005
(3)ダメな統計学、アレックス・ラインハート(西原史暁 訳)、勁草書房、2017
[ad#ad3]