正規分布の検出 解説 2024.08.04 分析・観察して得たデータが 『 正規分布しているかどうかを確かめること 』(1) ,(2)は 統計解析の ステップ 3 である.ステップ 1 は 『 特性が均一の個体を選ぶこと』,ステップ 2 は 『 外れ値を除去すること』になる. (1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P.106 (2) 池田郁男 改訂増補版:統計検定を理解せずに使っている人のために Ⅰ2019 化学と生物 57(8) P.498 正規分布の検出について 正規分布しているかどうかを検定する主なものには,シャピロ・ウィルクス検定,コスモゴロフ・スミルノフ検定,アンダーソン・ダーリング検定などがある.これらの特性を以下に示す. コスモゴロフ・スミルノフ検定を Python スクリプトで示す # Python によるコルモゴロフ・スミルノフ検定 import pandas as pd from scipy.stats import kstest from openpyxl import load_workbook # エクセルファイルのパスを指定 file_path = ‘C:/Users/あなたのファイル/Desktop /data.xlsx’ # エクセルファイルの読み込み df = pd.read_excel(file_path) # コルモゴロフ・スミルノフ検定の実行 data = df.iloc[:, 0] # 最初の列を使用 stat, p_value = kstest(data, ‘norm’) # 検定結果の作成 result_df = pd.DataFrame({ ‘Test’: [‘Kolmogorov-Smirnov’], ‘Statistic’: [stat], ‘p-value’: [p_value] }) # 正規性の判断 if p_value < 0.05: conclusion = “データは正規分布に従っていないと判断されます。” else: conclusion = “データは正規分布に従っていると判断されます。” # 検定結果に判断を追加 result_df[‘Conclusion’] = [conclusion] # 結果を新しいシートに書き込む with pd.ExcelWriter(file_path, engine=’openpyxl’, mode=’a’) as writer: result_df.to_excel(writer, sheet_name=’KS_Test_Result’, index=False) print(“コルモゴロフ・スミルノフ検定の結果がエクセルファイルに書き込まれました エクセルファイルを下に示す. ●検定結果のエクセル sheet を以下に示す. まとめ ステップ 1 『 特性が均一の個体を選ぶ 』 ステップ 2 『 得られたデータから外れ値を除去する 』 ステップ 3 『 データに対して正規分布であるかの検定をし,データが正規分布をするかどうかを判断する 』 これらの後に統計解析をおこなうこと.