解説

解説

帰無仮説

差がないと仮定するのが帰無仮説 坂巻は帰無仮説を「誤っていることを示したい「正しい」と想定したモデル」とし,対立仮説を「正しいことを示したい「正しい」と想定したモデルと定義している1).石居は 検定を行うには棄却検定法とよぼれる方法が魅入られ,そのための統計学上の仮説がたてられる.その仮説が帰無仮説であり,この帰無仮説と反対の仮説が対立仮説である としている2).帰無仮説は対照と処理では「差がない」として仮説検定が行われる.すべての場合において,差があることを証明することは不可能なので,差がないことを証明する方法がとられている3) 1) 坂巻顕太郎・篠崎智大 2023 生物統計学の道標 一般財団法人 厚生労働統計協会 P 77 2) 石居 進 1975 生物統計学入門 培風館 P 67 3) 川瀬雅也・松田史生 2021 生命科学・生物工学のための間違いから学ぶ実践統計解析 p 32 - ...
解説

P 値の書き方

P 値の記載方法 このブログでは,P 値についての解説はしていない.P 値は 有意性検定(NHST:Null Hypothesis Significance Testing)において閾値となるので,どのような記載をするかは統一しておいたほうがよいと考える.私は 20 年くらいは P = 0.003 (P イタリック・大文字)の記載法をとっていた.この P 値の根拠は,ISO規格に関する統計用語では、「P 値」の「P」は大文字のイタリックで表記されることが推奨されていることによる(1). (1) 清水信博 もう悩まない!論文が書ける統計 2040 オーエムエス出版 P.27 ChatGPT - 4o と P value ChatGPT - 4o は,P value に決まったスタイルはないとし,Natureスタイルガイドとして P (イタリックなし大文字)value (1),APAスタイルガ...
解説

有意性検定と統計的仮説検定

統計的仮説検定 統計的仮説検定とは,標本のデータを調べ,そして期待されるデータの分布と比べることによってこの期待される分布をもたらすべき仮説を受け入れるか,あるいはその仮説を棄却して,他の仮説を受け入れるかを決定することである(1). 有意性検定とは,P 値は正しいと想定したモデル と 観察されたデータの乖離の程度 を 示す指標(2)として解釈 する検定を示す.つまり,統計的仮説検定は P 値によって仮説を受け入れるかどうか までを含んでおり,有意性検定は 仮説の希釈あるいは保留を含んではいない検定である. しかし,多くの検定において,有意性検定と統計的仮説検定を混ぜたものである(3).筆者が経験した 植物生理学,園芸学,植物育種学,植物分子生物学のおいては,P 値を示す検定は ほぼ,統計的仮説検定であった. (1) 坂巻顕太郎 2023 年 第 8 回 検定と P 値 生物統計学の道標 ...
解説

標準誤差

多くの統計解析に関する書籍あるいはネットでの解説において,標準誤差はあいまいな表現がされている.その原因は,数学的に正確な表現をしているからである.このブログでは生物統計学を基礎としての標準誤差の解説していく. 生物統計学として標準誤差の解説 ① 対象とする集団からデータをとるサンプルを たとえば 10 個選ぶ. ② この 10 個のサンプルを分析してそれぞれのデータを得る. ③ これら 10 個のデータから平均を算出する. ④ ① ~ ③ の操作を たとえば 5 回 繰り返す. ⑤ 平均が 5 つ 得られる.この 5 つの平均から標準偏差を算出する. ⑥ 得られた 標準偏差 が 標準誤差になる. 標準誤差は平均を算出し,その平均が母集団の平均からどれだけばらつくかを表した基本統計量ということになる(1).これに対して標準偏差は,母集団の平均からデータが どれだけ ばらついているか を表す...
解説

標準偏差

標準偏差はデータのばらつき程度を示す指標となる基本統計量である(1).標準偏差は正規分布していないデータでも使用することができる(2).私自身も『 正規分布していない可能性のあるデータには標準偏差は使えない 』と誤解していた. (1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P.49 (2) 石居 進 生物統計学入門 1975 培風館 P.23 上述の誤解は,データが正規分布しているときには,データの約68%が平均から1標準偏差以内、約95%が2標準偏差以内、約99.7%が3標準偏差以内に収まる (1),(2),(3),(4),(5),(6)ということが,必ず統計解析の書籍には示されていることによると考えている. (1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学1983...
解説

グラフを用いる意味

表を用いて統計解析の結果を示すと テキストベースになるため,データ全体をすばやく理解することは困難である.わかりづらいという欠点から,表は エビデンス(科学的な証拠)を示す方法としてとても弱い方法ということになる.テキストでデータを示す表と比べて,イラストで示すグラフを使ったほうが,統計解析結果を理解しやすくなる. 多重検定の結果をグラフで示す 生データとともに Tukey - Kramer 多重検定の結果を示した表を示す. 次に,Tukey - Kramer 多重検定の結果をグラフで示す. グラフのほうが対照,処理 A,処理 B の平均,標準誤差および多重検定の結果を可視的にとられることができる.なお,このグラフは生物学の古典的な形式で書いている.ビジネスではグラフの説明は簡略化して示すことが多いが,統計解析の結果については,このグラフにように必要なすべての情報を示しすほうがよい. 標準...
解説

正規分布の検出

分析・観察して得たデータが 『 正規分布しているかどうかを確かめること 』(1) ,(2)は 統計解析の ステップ 3 である.ステップ 1 は 『 特性が均一の個体を選ぶこと』,ステップ 2 は 『 外れ値を除去すること』になる. (1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P.106 (2) 池田郁男 改訂増補版:統計検定を理解せずに使っている人のために Ⅰ2019 化学と生物 57(8) P.498  正規分布の検出について 正規分布しているかどうかを検定する主なものには,シャピロ・ウィルクス検定,コスモゴロフ・スミルノフ検定,アンダーソン・ダーリング検定などがある.これらの特性を以下に示す. コスモゴロフ・スミルノフ検定を Python スクリプトで示す # Python によるコルモゴロフ・スミルノフ検定...
解説

Python で 正規分布を ChatGPT – 4 で描く

ChatGPT - 4 に Python スクリプトおよび 得られた正規分布の図を以下に示した. # Python で 正規分布の図を描く import numpy as np import matplotlib.pyplot as plt # 正規分布のパラメータ mu = 0 # 平均値 sigma = 1 # 標準偏差 # 点の生成 x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100) y = (1 / (np.sqrt(2 * np.pi * sigma**2))) * np.exp(-((x - mu)**2) / (2 * sigma**2)) # 図の作成 plt.figure(figsize=(8, 5)) plt.plot(x, y, label=f'μ={mu}, σ={sigma}') plt.title('正規分布のグラフ...
解説

確率分布

確率分布はいくつかの種類があり,それぞれ異なる特性を持っているので,その特性に適した統計解析やモデリングに使用されている.研究やデータ解析の目的に応じて、適切な確率分布を選択しなければ適切な統計解析はできない. 確率変数および確率分布 確率変数および確率分布について説明する.ダーツの矢を高さ 1 m から落とし,下の平面に定めた1点 および 落としたダールの矢の距離(データとする) を測定する実験 を考えることにする.定めた1点とダーツの矢の距離は,ダーツの矢を離すときの,指の力を緩める程度,実験場の風速,矢がおちる間に通過する空気の状態など に影響されて,連続的な値(データ)を示すことになる.ダーツの矢が落ちた点 と 定めた1点との距離は、理論上、無限に小さな値として計測できるため、得られるデータは連続変数とみなすことができる. ダーツの矢を高さ1mから落とすこの実験では、矢が落ちる場所...
解説

R および Python を使った統計解析

オープンソースのプログラム言語が初心者に困難な理由 統計解析のプログラム言語としてよく用いられているのは R および Python である(1).これらは,オープンソースのプログラム言語なので,ユーザーはソースコードの閲覧、変更、利用、再配布を自由することができる.このようなオープンソースのプログラム言語は無料であるが,これを使い続けるためには,① 専門的な知識の習得,② ユーザーコミュニティによって継続的な開発と改善が続けられているので,絶え間ないアップデートが必要になる.今回は R および Python を使って統計解析のプログラムをすることついて解説する. (1) 川瀬雅也・松田史生 2021 生命科学・生物工学のための間違いから学ぶ実践統計解析 R・Python によるデータ処理事始め 日本生物工学会 編 近代科学社 Digital 2021 年 統合開発環境を利用して絶え間ないア...