生物統計学からみた統計解析

多重検定（多重比較）

この投稿は未完成のVer. 1 スチューデントの t 検定では，対照と処理の平均を比較することしかできない．生物学関連の研究では，対照と処理の 2 群だけの平均を比較することはとてもすくない．多くの場合は，対照，処理 1，処理 2，処理 3 くらいの平均値を比較し，いずれの集団（群）の平均が統計的に有意な差を認めてよいかを問題にしている．スチューデントの t 検定を繰り返して，統計的に有意な差がある集団の平均をみいだすことは，多重性の問題が起こるので利用できない．平均を比較するたびに第 1 種の過誤が大きくなるので，これを補正するように提案されたのが多重検定である．ダンカンの多重検定は使えない筆者が学生時代（1980 年代初）には，多重検定とえば，まだ，ダンカンの多重検定（Duncan's multiple range test）が使われている論文が存在した．しかし，現在においては，ダン...

2025.08.07

解説

正規分布の検出

Ver. 2　前回の更新　2024 年 8 月 4 日データの集団群（例　対照，処理１，処理２，処理３，処理４）に対して，検定を繰り返すことは，多重性の問題を引き起こすことになる．かっては，代表的な統計解析ソフトである SPSS でも，一元配置分散分析をしてから，多重検定をするように設定されていた．しかし，現在では，データの集団群に正規分布性のの検出をしてから，統計的仮説検定をすることは，多重性の問題をまねくので統計学的にはよくない行為とされることが多くなってきている．こうした理由から，正規分布の検定をすることなく，統計的仮説検定をすることが求められてきている．分析・観察して得たデータが『正規分布しているかどうかを確かめること』(1) ,(2)は統計解析のステップ 3 である．ステップ 1 は『特性が均一の個体を選ぶこと』，ステップ 2 は『外れ値を除去すること』になる．...

2025.07.19

解説

箱ひげ図

Ver.2.1 　前回の更新　2025 年 6 月 21 日箱ひげ図は，①最小値，②最大値，③平均，④四分位範囲，⑤中央値　⑥外れ値によって，データのばらつきを示している1).1) 川瀬雅也・松田史生生命科学・生物工学のための間違いから学ぶ実践統計解析　R・Python によるデータ処理事始め　2021 日本生物工学会編　近代科学社 Digital　P.10 - 17ChatGPT-4o による箱ひげ図の作成ChatGPT - 4o が示した箱ひげ図作成の Python スクリプトで描かれたものをもとにし，以下の図をパワーポイントで作成した．左は Python で描いた元の箱ひげ図である．四分位範囲とはデータの 50%がはいる範囲のことで，この範囲からはずれ値を算出している．このように箱ひげ図は直観的にデータのばらつきを知るにはとても便利な図である．しかし，箱ひげ図は ①　箱ひ...

2025.07.19

解説

外れ値の検出

Ver. 2　前回の更新　2024 年 10 月 28 日データの集団群（例　対照，処理１，処理２，処理３，処理４）に対して，検定を繰り返すことは，多重性の問題を引き起こすことになる．かっては，代表的な統計解析ソフトである SPSS でも，一元配置分散分析をしてから，多重検定をするように設定されていた．しかし，現在では，データの集団群に外れ値の検定をしてから，つづいて統計的仮説検定検定をすることは，多重性の問題をまねくので統計学的にはよくない行為とされることが多くなってきている．したがって，外れ値の検定をすることなく，統計的仮説検定をすることが求められるようになってきている．外れ値とは測定・観察したデータのうち真の値からかけ離れた数値を示すデータのことである．外れ値はヒューマンエラーで起こることが多いので，統計解析をするうえで，最も大切なことは，外れ値の検出を使わないですむように分析・観...

2025.07.19

解説

分散が等しいかを検定する

Ver. 1.1 　前回の更新　2025 年 7 月 15 日データの集団群（例　対照，処理１，処理２，処理３，処理４）に対して，検定を繰り返すことは，多重性の問題を引き起こすことになる．かっては，代表的な統計解析ソフトである SPSS でも，一元配置分散分析をしてから，多重検定をするように設定されていた．しかし，現在では，データの集団群に等分散の検定をしてから，統計的仮説検定をすることは，多重性の問題をまねくので統計学的にはよくない行為とされることが多くなってきている．したがって，等分散の検定をすることなく，統計的仮説検定をすることが求められるようになってきた．Leven 検定および F 検定対照と処理のように，集団 A と集団 B が同一集団に属するかどうかの検定，つまり，対照と処理が異なる集団であるかどうかの検定について解説する．対照と処理が異なる集団であるならば，この処理によ...

2025.07.19

解説

統計解析をする意味

Ver. 1.2　前回の更新　2024 年 10 月 28 日生物統計学はパワフルなツールであるこのブログでは，①なぜ統計解析をする必要があるか？　②統計解析の結果を正しく考察するにはどうすればよいのか？を解説していくことにする．私は大学教員として情報処理・生物統計学の演習を通算 20 年くらい担当していた．生物統計学との出会いは大学２年生のときの学生実験である．『統計学を使うと平均値間において統計的に有意な差があるかどうかを示すができるのか・・・』と深く感動したことを覚えている．上級国家公務員試験に合格して農林水産省に入省し，特許事務所，2 つの企業の研究所を経て，母校の農学部助手に採用され，講師になって生物統計学を担当することになった．それから大学を定年退職した今日にいたるまで，(1) 生物統計学を科学的な証拠（エビデンス）として利用するにはどうすればよいか？ (2) 統計解析...

2025.07.19

解説

2 群の比較の検定

Ver. 1.1　前回の更新　2025 年 2 月 15 日スチューデントの t 検定，ウェルチの t 検定，マン・ホイットニの U 検定対照と処理に統計的に有意な差があるかどうかを検定する方法としては，スチューデントの t 検定（二標本 t 検定），ウェルチの t 検定，マン・ホイットニの U 検定がある．スチューデントの t 検定については，同じ検体を使っている場合（はじめに計測をし，その後に処理をし再度，同じ検体を計測するなど）対応のある t 検定（一標本 t 検定）を利用する1)．1) 清水信博　2004 年　もう悩まない！論文が書ける統計　オーエムエス社　p.56スチューデントの t 検定（二標本 t 検定），ウェルチの t 検定，マン・ホイットニの U 検定を使用する際に集団あるいは集団間について，正規分布，等分散および帰無仮説を下に示した．この表に従うと，たとえば，スチューデ...

2025.07.19

解説

多重性の問題 – 同じデータに検定をくりかえしてよいか？

Ver. 2.2　前回の更新　2025年6月21日統計的な意味での多重性の問題同一のデータ群（具体例　実験あるいは観察で得た測定値・観察値の集団『対照，群A，群B，群C 』．『対照，処理 1，処理 2，処理 3，処理 4 』．『対照，集団 1，集団 2．集団 3，集団 4，集団 5 』）について，統計処理を２回以上，繰り返すことは，以下に説明する多重性の問題を起こすことになるので，統計学的には正しくない統計解析である．つまり，実験あるいは観察で得た測定値・観察値の集団『対照，群A，群B，群C 』，『対照，処理 1，処理 2，処理 3，処理 4 』あるいは『対照，集団 1，集団 2．集団 3，集団 4，集団 5 』などについて，正規分布の検出，外れ値の検出，等分散の検定などをしてから，スチューデントのｔ検定をすることは，統計学的には行ってはいけない行為になるのである．同様に...

2025.07.19

解説

帰無仮説

差がないと仮定するのが帰無仮説坂巻は帰無仮説を「誤っていることを示したい「正しい」と想定したモデル」とし，対立仮説を「正しいことを示したい「正しい」と想定したモデルと定義している1)．石居は検定を行うには棄却検定法とよぼれる方法が魅入られ，そのための統計学上の仮説がたてられる．その仮説が帰無仮説であり，この帰無仮説と反対の仮説が対立仮説であるとしている2)．帰無仮説は対照と処理では「差がない」として仮説検定が行われる．すべての場合において，差があることを証明することは不可能なので，差がないことを証明する方法がとられている3)1) 坂巻顕太郎・篠崎智大　2023　生物統計学の道標　一般財団法人厚生労働統計協会 P 772) 石居　進　1975　生物統計学入門　培風館 P 673) 川瀬雅也・松田史生　2021 生命科学・生物工学のための間違いから学ぶ実践統計解析 p 32 - 33　仮...

2024.10.28

解説

P 値の書き方

P 値の記載方法このブログでは，P 値についての解説はしていない．P 値は有意性検定（NHST：Null Hypothesis Significance Testing）において閾値となるので，どのような記載をするかは統一しておいたほうがよいと考える．私は 20 年くらいは P = 0.003 (P イタリック・大文字)の記載法をとっていた．この P 値の根拠は，ISO規格に関する統計用語では、「P 値」の「P」は大文字のイタリックで表記されることが推奨されていることによる(1)．(1) 清水信博もう悩まない！論文が書ける統計 2040 オーエムエス出版 P.27ChatGPT - 4o と P valueChatGPT - 4o は，P value に決まったスタイルはないとし，Natureスタイルガイドとして P （イタリックなし大文字）value (1)，APAスタイルガイドとし...

2024.08.23

解説