標準偏差

標準偏差はデータのばらつき程度を示す指標となる基本統計量である(1).標準偏差は正規分布していないデータでも使用することができる(2).私自身も『 正規分布していない可能性のあるデータには標準偏差は使えない 』と誤解していた.

(1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P.49

(2) 石居 進 生物統計学入門 1975 培風館 P.23

上述の誤解は,データが正規分布しているときには,データの約68%が平均から1標準偏差以内、約95%が2標準偏差以内、約99.7%が3標準偏差以内に収まる (1),(2),(3),(4),(5),(6)ということが,必ず統計解析の書籍には示されていることによると考えている.

(1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学1983 共立出版 P.61 – 115

(2) 生物統計学入門  培風館 1975 年 P.36 – 64

(3) 清水信博 もう悩まない!論文が書ける統計 2004 オーエムエス出版 P.13 -28

(4) 池田郁男 改訂増補版:統計検定を理解せずに使っている人のために Ⅰ 2019 化学と生物 57(8)

(5) 上田鋼平 第 7 回 推測の基準 2023 監修・執筆 板巻顕太郎 篠崎智大 生物統計学の道標  研究デザインから論文報告までをより深く理解するための24 講 一般社団法人 厚生労働統計協会 P.56 – 67

(6) 川瀬雅也・松田史生 生命科学・生物工学のための間違いから学ぶ実践統計解析 R・Python によるデータ処理事始め 2024 日本生物工学会 編 近代科学社 Digital 2021 年 P.18- 39

標準偏差は 各データの平均からのばらつき を示す指標である.標準偏差が大きいほどデータが平均値から広くばらついていることを示す.

標準偏差を算出する R スクリプト

# R による標準偏差

library(readxl)

library(writexl)

# エクセルファイルのパスを設定(デスクトップにある “data.xlsx” ファイルを想定)

file_path <-“C:/Users/a56f3/Desktop/data.xlsx”

# エクセルファイルの読み込み

df <- read_excel(file_path)

# 最初の列のデータを使用して標準偏差と平均を計算

data <- df[[1]]  # 最初の列を使用

std_dev <- sd(data)

mean_val <- mean(data)

# 結果をデータフレームにまとめる

result_df <- data.frame(Metric = c(“Standard Deviation”, “Mean”), Value = c(std_dev, mean_val))

# 結果を新しいシートに書き込む

write_xlsx(list(“Results” = result_df), path = file_path, col_names = TRUE)

print(“標準偏差と平均がエクセルファイルに書き込まれました。”)

標準偏差は 平均 ± 標準偏差 で表す.

今回の結果はエクセルの sheet2 に以下のように表示される.

したがって,48.6 ± 3.5 と表記することになる.なお,標準偏差は SD と略して示される.

まとめ

(1) 標準偏差は データのばらつき程度を示す指標 となる基本統計量である.

(2) 標準偏差は正規分布していないデータでも利用できる.

(3) 標準偏差は SD として略され,平均 ± 標準偏差 で表記される.例 48.6 ± 3.5