多重検定(多重比較)
解説
この投稿は 未完成のVer. 1
スチューデントの t 検定では,対照と処理の平均を比較することしかできない.
生物学関連の研究では,対照と処理の 2 群だけの平均を比較することはとてもすくない.多くの場合は,対照,処理 1,処理 2,処理 3 くらいの平均値を比較し,いずれの集団(群)の平均が統計的に有意な差を認めてよいかを問題にしている.
スチューデントの t 検定を繰り返して,統計的に有意な差がある集団の平均をみいだすことは,多重性の問題が起こるので利用できない.平均を比較するたびに第 1 種の過誤が大きくなるので,これを補正するように提案されたのが多重検定である.
ダンカンの多重検定は使えない
筆者が学生時代(1980 年代初)には,多重検定とえば,まだ,ダンカンの多重検定(Duncan’s multiple range test)が使われている論文が存在した.しかし,現在においては,ダンカンの多重検定は第 1 種の過誤を抑えきれないとして利用されていない.
Tukey – Kramer 多重検定
ダンカンの多重検定(1955 年),Tukey の多重検定(1953 年),Tukey – Kramer の多重検定(1956 年)と,これら有名な多重検定が発表されたのは,70 年くらい前のことである.サンプルサイズが等しいときは,Tukey 多重検定を使用し,サンプルサイズが 等しくない場合は,Tukey – Kramer 多重検定(1956 年)を使用する.
濃度,温度あるいは時間など連続量が説明変数の場合は多重検定は使わない
多くの論文において,最適な濃度,温度 あるいは 時間を決定する場合に多重検定が利用されている.しかし,これは統計学的には正しくない.多重検定は,不連続な説明変数の場合に利用するものであり,濃度,温度 あるいは 時間などの連続量には回帰分析を使用するべきである.なお,筆者は,濃度,温度 あるいは 時間などの連続量に回帰分析を使用している論文を読んだことはほとんどない.これは,論文の筆者および論文のレフェリーが正しく多重検定を知らないで利用していることによると考えている.もっとも,いくつかの濃度の範囲を 1 つの不連続しの集団と仮定した場合は,慣例的に多重検定の利用が慣例的に認めれていると考え,『 多重検定を連続量に使うのは正しくないとはしない 』という考え方があることも知るべきであろう.
算出された統計量を判断する者によって,いずれの統計解析を使うかを決めることが,統計学では必要とされるのである.たとえば,統計学に真摯な判断者の場合は,連続量には多重検定をつかわず,回帰分析を用いなければならない.統計学を最適な値あるいは領域を決定する手段と割り切る判断者には,連続量でも多重検定を使用してもよいことになる.