目次
p値って結局のところ何なの?
最近は学術研究に取り組む理学療法士・作業療法士も増えております.
研究初学者の理学療法士・作業療法士がつまずくことが多いのがp値の解釈です.
今回はp値って結局のところ何なのかについて考えてみたいと思います.
p値<0.05で喜ぶ理学療法士・作業療法士
統計解析を経験したことのある理学療法士・作業療法士であればp値と向き合う機会は多いと思います.
p<0.05なら差がある,p≥0.05なら差がない(厳密には差があるかないか分からない).
多くの理学療法士・作業療法士が差を証明したいので,「p<0.05,やったー」という感じだと思います.
一方で「p値だけみるのは危険だ」といった話も耳にされたことがあるかもしれません.
p値ってどう解釈すればいいの?
例えば男性と女性の握力を比較したいとします.
男性の握力の平均は40kg,女性の握力の平均は30kgでした.
握力は男性の方が女性より強いと言えるでしょうか?
こういった疑問に答えるのがp値です.
男性と女性のそれぞれの握力データがあれば,統計ソフトで簡単にp値を計算できます.
p値<0.05だと「握力は男性の方が女性より強いと言える」と結論している人がほとんどだと思います.
しかしながらこれではp値の本質を理解できていないと言えるでしょう.
正確には「真実は男性と女性の握力が同じであると仮定したら,握力が男性と女性でこれほどの違い(平均10kg以上の差)が認められる確率」がp値なのです.
p=0.03であれば,「男女間で握力が同じ確率は3%だ」という解釈になります.
有意水準って?
p値というのは有意確率と翻訳されることが多いですが,有意確率と合わせて使用する機会が多い用語として有意水準といった表現が挙げられます.
有意水準というのはp値のカットオフ値のことです.
有意水準=0.05の場合には,真実は男性と女性の握力が同じである時に,握力が男性と女性でこれほどの違い(平均10kg以上の差)が認められる確率が5%未満であれば,その5%は無視するに足ると考えるということを表します.
その場合には,男性と女性の握力が同じであるという事が真実だとは考えにくいと考えて男性と女性の握力に差があると考えるわけです.
簡単に言うと本当は男性の握力=女性の握力なのに男性の握力≠女性の握力と今結論してしまっている確率がp値ということになります.
単純には有意確率<有意水準であれば,その確率は無視できると考えて,男性の握力≠女性の握力と結論します.
有意確率p値を有意水準として解釈してはいけません.
つまりp値=0.02だったから本当は真実なのに誤って有意でないとしてしまう確率=2%という解釈は誤りです.
基本的には有意水準は研究の前に決めておくものです.
有意水準=0.05が妥当か?
有意水準に関してご説明させていただきましたが,0.05をp値のカットオフとしてしまうといくつか問題があります.
この問題は例えばStanford大学の疫学グループのJohn Ioannidisという教授が,権威ある医学雑誌で繰り返し主張されております.
一番大きな問題は理学療法士・作業療法士がp値しかみないという点です.
差があるといっても,運動療法がアウトカムを20%改善するのか,5%改善するのかでは大きな違いがあります.
しかしながらたいていの場合には,p<0.05なら運動療法は効果があったといった結論しか注目されないという点が問題です.
p値しか見ない理学療法士・作業療法士のreviewerは,p<0.05の論文しか採択しません.
特に観察研究なんかでは統計解析や研究デザインをいろいろと変更すれば,ある程度恣意的に5%を下回るp値を算出することが可能です.
結果として恣意的に出したp値の論文しかpublishされないという問題が生まれてしまいます.
また解析やデザインが正しくても5%の結果(論文)は真実と異なります.
つまり本当は差がないのにあるとする論文が増えてしまうことになります.
有意水準=0.05ですと簡単に有意差が出ますので誰でも論文が書けてしまい世の中に論文が氾濫しているのは間違いありません.
最近では有意水準=0.05は妥当でなく,有意水準を0.005や0.001にすべきだといった議論も多くなされております.
今回はp値って結局のところ何なのかについて考えてみました.
p値というのは,本当は差がないのにこの研究で認められた程以上の差が出てしまう確率でそれ以上でも以下でもありません.
これをきちんと理解し,論文抄読や自分の研究に活かせるとよいですね.