統計解析方法って論文読んでるといろいろ出てくるけど、なぜその統計解析方法なの?どうやって選択しているの?って思ったことはありませんか?
実は求めたい結果の尺度と要因の数によっておおまかに変わってきます。では見ていきましょう。
Contents
データの型(尺度)
- 間隔尺度(間隔に意味がある)
・連続量:バイタルサイン、血液検査値など
・離散量:服用錠数、転倒回数など - 順序尺度(大小関係のみに意味がある)
・副作用グレード、疾病ステージなど - 計数尺度(他と区別し分類するための名称)
・二値計数:死亡/生存、発症/非発症など
・分類:病変部位など
間隔尺度はその間隔に意味がある尺度です。バイタルサインの一つである血圧を例にすると、収縮期血圧120mmHgか160mmHgかで意味が変わってきますよね。数値自体にも意味がある尺度です。
順序尺度は副作用グレード、疾病ステージなど大小関係のみに意味がある尺度です。心不全のNYHA分類を例にとると、Ⅰ~Ⅳまでありますが、大小関係には意味がありますが、間隔には意味がありません。
NYHA分類についてはコチラの記事をご参照ください。
計数尺度とは他と区別し分類されるための名称です(名義尺度というほうが一般的かもしれません)。もう少し詳しく言うと対象のさまざまな属性を分類するために“ラベル”として数値を割りあてた数のことです。例えば、二値計数では死亡/生存や発症/非発症を0と1のラベルに当てはめて分類します。数値自体には意味がない尺度ですね。
単因子解析
一つの要因について、群間に有意な差があるか否かを統計学的視点から検証する手法のことを単因子解析といいます。
分布型や尺度によって使用される統計解析方法が変わってきます。
Student’sのt検定やカイ(χ)2乗検定など聞いたことのある解析方法ではないでしょうか?
“論文を批判的吟味する”は“統計解析方法を理解する”ではありませんので、統計解析の専門家でもないですし論文でちゃんと統計解析をされているという確認程度でも良いと思います。(可能であれば正しい解析方法が使われているかを確認したほうが良いと思いますが、査読をしっかりしているジャーナルであれば順序尺度なのにStudent’sのt検定を使用しているなどといったこともおそらくないとは思います。)
多変量解析
アウトカムの発生に複数の因子が同時に寄与している可能性がある場合、それらの因子の違いを統計学的に調整した上で試験薬のみの効果を推測する手法のことを多変量解析といいます。
Cox比例ハザード分析は生死を時間の経過でみた生存曲線など目にする機会も多いかもしれません。
単因子解析のところでも記載しましたが解析方法についてはなんとなく違いが分かっていただければ、詳しく分かっていなくても大丈夫です。
自分で統計検定を行うわけではなく、あくまで読み手なのでそこまでの理解は必要ありません。(自分で統計検定を行う場合でも統計ソフトの力でできてしまうかもしれませんが…)
ひとつひとつの統計解析方法についての詳細は専門書等をご参照ください。
まとめ
- 解析方法は尺度と要因の数で決まる。
- 尺度には間隔尺度、順序尺度、計数尺度がある。
- 要因が一つの場合は単因子解析、複数の場合は多変量解析となる。
なんとなく統計解析方法がどのように選択されているかが分かったのではないでしょうか。
ある程度どのように選択されるか記載しましたが、論文の批判的吟味では統計解析方法を理解していなくても評価することは可能です。
つまり各統計解析方法の詳細を理解していなくても、論文に記載している結果をどのように評価するかという結果の捉え方が分かっていれば良いということです。
統計解析方法よりも「平均値と中央値」や「有意水準」、「優越性・非劣性」の方が結果を捉えるという意味では大事だと思いますので、難しければ統計解析方法は後回しでこれらを先に理解するべきだと思います。よろしければ以下の記事たちをご参照ください。