日外会誌. 121(5): 551-553, 2020
臨床研究セミナー記録
日本外科学会・日本臨床外科学会共催(第81回日本臨床外科学会総会開催時)
第23回臨床研究セミナー
第1部 臨床研究の基礎講座
1.査読者の立場から見た医学論文における統計解析の留意点
新潟大学医歯学総合病院 医療情報部 赤澤 宏平 (2019年11月16日受付) |
キーワード
ロジスティック回帰分析, Coxの比例ハザードモデル, 交絡因子, 変数選択
I.はじめに
外科学の臨床研究において統計解析は頻繁に行われている.その中には,解析プロセスに問題があり,正しい結果を導いていない論文も見受けられる.本稿では,多変量回帰分析(ロジスティック回帰分析とCoxの比例ハザードモデル)における説明変数の選び方で留意すべき点を述べる.
II.多変量回帰分析はなぜ必要か?
図1は多変量回帰分析の概要を示した.なぜ多変量解析を行わなければならないか?の答えは「各説明変数が結果変数にどの程度影響を与えるのかを説明変数の内部相関を補正して評価する必要がある」からである.一般に,データ項目(説明変数)にはお互いに何らかの相関関係がある.その相関の影響度を補正するために多変量解析を用いる.
III.多変量回帰分析における説明変数を選択する際の留意点
結果変数に関与する説明変数を見つけるには,単一因子解析と多変量回帰分析を用いる.単一因子解析では,各説明変数と結果変数の関連をカイ2乗検定やログランク検定で検定する.多変量回帰分析は複数の説明変数をモデルに入れて,相互の内部相関を補正したうえで各説明変数の結果変数への影響度を推測する.
臨床研究では,多変量回帰分析に入れる説明変数を,単一因子解析で有意だった変数だけとする方法が用いられる.臨床論文でよく見る方法であるが,説明変数を正しく選択する方法とは言えない.
その理由は,結果変数に強く影響を与える説明変数であっても,交絡因子があると,単一因子解析では見かけ上,有意に影響する変数とはならないことがあるからである.
多変量回帰分析による交絡因子の効果の補正を示すために仮想的なデータを図2に示す.二つの治療法(A法,B法)の治療効果の優劣を検証したいとする.治療法と治療効果の関係は図2-1で示され,カイ2乗検定の結果,P=0.572であり2治療法の治療効果に有意差はない.一方,治療法と年齢(60歳未満,60歳以上)ではA法で60歳以上が多く(図2-2),60歳以上は無効例が多い(図2-3).この年齢のように,治療法と治療効果の両方に関与する因子を交絡因子と呼ぶ.
治療法と年齢をロジスティック回帰分析に入れた結果が図3である.年齢の効果を補正して治療法の優劣を評価すると,B法(コードが0)に対するA法(コードが1)の治療有効のオッズ比は2.67,その95%信頼区間は1を含まない.A法がB法に比べて有意に治療効果が高いことが立証された.誌面の都合でクロス集計結果は示せないが,60歳以上の100例ではA法,B法の有効率は40%と20%であり,60歳未満での有効率はA法80%,B法60%である.
この事例から,単一因子解析での有意な説明変数のみをロジスティック回帰分析に入れる変数選択手法は,誤った解析結果を発表する可能性があることがわかる.一方,すべての説明変数を回帰モデルに入れてしまうと,互いに相関の強い変数で推定回帰係数が異常に大きくなったり小さくなったり正しい推定ができないことがある.では,どうすればよいか?
多変量回帰分析において,多くの説明変数から内部相関を補正したうえで,結果変数に有意な影響を与える変数を選び出すひとつの方法として,逐次変数選択法(ステップワイズ法)がある.この手法を使うことにより,互いに相関が強い説明変数ではどちらか一方はモデルから除去される.またモデルに入っている変数間では内部相関(交絡関係)の影響を補正できる.内部相関は,2変数間の相関分析や散布図,クロス集計表からでは検出できない.逐次変数選択法は,臨床研究で使われる統計解析ソフトウエアSAS,SPSS,STATAなどでオプションで使用可能である.
IV.おわりに
多重ロジスティック回帰分析やCoxの比例ハザードモデルによる生存時間解析などの多変量回帰分析において,モデルに入れる説明変数を単一因子解析で選定する方法は,誤った解析結果を導く可能性があることを示した.多変量回帰分析では,モデルに入れる変数を逐次変数選択法を含む適切な手法で選ぶことが必要である.
利益相反:なし
PDFを閲覧するためには Adobe Reader が必要です。