標準偏差はデータのばらつき程度を示す指標となる基本統計量である(1).標準偏差は正規分布していないデータでも使用することができる(2).私自身も『 正規分布していない可能性のあるデータには標準偏差は使えない 』と誤解していた.
(1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P.49
(2) 石居 進 生物統計学入門 1975 培風館 P.23
上述の誤解は,データが正規分布しているときには,データの約68%が平均から1標準偏差以内、約95%が2標準偏差以内、約99.7%が3標準偏差以内に収まる (1),(2),(3),(4),(5),(6)ということが,必ず統計解析の書籍には示されていることによると考えている.
(1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学1983 共立出版 P.61 – 115
(2) 生物統計学入門 培風館 1975 年 P.36 – 64
(3) 清水信博 もう悩まない!論文が書ける統計 2004 オーエムエス出版 P.13 -28
(4) 池田郁男 改訂増補版:統計検定を理解せずに使っている人のために Ⅰ 2019 化学と生物 57(8)
(5) 上田鋼平 第 7 回 推測の基準 2023 監修・執筆 板巻顕太郎 篠崎智大 生物統計学の道標 研究デザインから論文報告までをより深く理解するための24 講 一般社団法人 厚生労働統計協会 P.56 – 67
(6) 川瀬雅也・松田史生 生命科学・生物工学のための間違いから学ぶ実践統計解析 R・Python によるデータ処理事始め 2024 日本生物工学会 編 近代科学社 Digital 2021 年 P.18- 39
標準偏差は 各データの平均からのばらつき を示す指標である.標準偏差が大きいほどデータが平均値から広くばらついていることを示す.
標準偏差を算出する R スクリプト
# R による標準偏差
library(readxl)
library(writexl)
# エクセルファイルのパスを設定(デスクトップにある “data.xlsx” ファイルを想定)
file_path <-“C:/Users/a56f3/Desktop/data.xlsx”
# エクセルファイルの読み込み
df <- read_excel(file_path)
# 最初の列のデータを使用して標準偏差と平均を計算
data <- df[[1]] # 最初の列を使用
std_dev <- sd(data)
mean_val <- mean(data)
# 結果をデータフレームにまとめる
result_df <- data.frame(Metric = c(“Standard Deviation”, “Mean”), Value = c(std_dev, mean_val))
# 結果を新しいシートに書き込む
write_xlsx(list(“Results” = result_df), path = file_path, col_names = TRUE)
print(“標準偏差と平均がエクセルファイルに書き込まれました。”)