R および Python を使った統計解析

オープンソースのプログラム言語が初心者に困難な理由

統計解析のプログラム言語としてよく用いられているのは R および Python である(1).これらは,オープンソースのプログラム言語なので,ユーザーはソースコードの閲覧、変更、利用、再配布を自由することができる.このようなオープンソースのプログラム言語は無料であるが,これを使い続けるためには,① 専門的な知識の習得,② ユーザーコミュニティによって継続的な開発と改善が続けられているので,絶え間ないアップデートが必要になる.今回は R および Python を使って統計解析のプログラムをすることついて解説する.

(1) 川瀬雅也・松田史生 2021 生命科学・生物工学のための間違いから学ぶ実践統計解析 R・Python によるデータ処理事始め 日本生物工学会 編 近代科学社 Digital 2021 年

統合開発環境を利用して絶え間ないアップデートに対応する

統合開発環境というと土木開発企業を連想してしまうが,総合環境開発とはプログラムをするときに便利な機能をまとめたソフトウェアのことである.私は R には RStudio,Python には Pycharm を使用している.これらの統合開発環境(Integrated Development Environment :IDE)において,私のような R および Python 初心者が最も頼りにできるのが プログラムに含まれるバグやエラーを検出し、修正するためのツールである デバッガ ( debugger )である.ディバッガに表示される文章や用語は初心者には難解である.しかし,ChatGPT – 4 にディバッガの回答を張り付ければ,エラーになった理由を場合分けして説明してくれる.また,RStudio および Pycharm ともに アップデートされたライブラリやパッケージを示してくれ,これらを選択すればインストールしてくれる.さらに,実行したいプログラムにインストールされていないライブラリあるいはパッケージを示してくれる.

以上の説明したようにある程度のハードルは超えていくことが可能ではある.しかしながら,統合開発環境の使い方を習得するには,あまたのトライ & エラー が必要である.このため,ある程度,忍耐と向上心がないとオープンソースのプラグラム言語は習得できない.だれでもできる Python とか いう感じのキャッチフレーズの書籍やネット記事は真実ではないということである.

まとめ

(1) オープンソースのプログラム言語を習得するには統合開発環境(Integrated Development Environment :IDE)ツールの習得が必要である.                   

(2) ChatGPT – 4 は 統合開発環境を使用するときにも パワフルなツールになる.

(3) オープンソースのプログラム言語を習得するハードルはとても高い.