ChatGPT – 4.0 と統計解析

ChatGPT – 4.0 の公開は大学教育にとって大きな影響を与えた.レポートや試験に対する教員の対策のような小さな問題から,学問とはなにか ?という哲学的な大問題にいたるまで,大学教員は大きな衝撃を覚えた.なお,学生さんへの対策として一番良い方法は,学生さんよりも ChatGPT – 4 を使いこなせるようになること である.

市販の統計解析ソフトとオープンソースのプログラム言語による統計解析

これまでの大学教員としての研究生活では SAS 社の JMP を使用してきた.もう 1 つのメジャーな統計解析ソフトとしては IBM 社の SPSS がある.Python および R で統計解析のプログラムをしていると,これらのオープンソースのプログラム言語では,ライブラリ(Python)あるいはパッケージ(R)のバージョンが月単位で更新されることに気がつく.このような更新に対応するためには,PyCharm(Python)あるいは RStudio(R)などのような統合開発環境を使うとよい.

しかし,このような(1)ライブラリあるいはパッケージへの更新への対応 や (2)統合開発環境(ソフトウェアあるいはプログラミング環境のこと)の使い方を習得することは,それなりの時間と理解力が要求されるので,初心者にとって大きなハードルになる.市販の統計解析ソフトである JMP や SPSS では,ある程度は自動のバージョンアップやソフト自体の有料バージョンアップはあるものの,オープンの統計解析にくらべて,越えるべきハードルは低くなりる.このように市販の統計解析ソフトは,それなりに高額であることを除いては,統計解析だけを専門とするのではない 私のような研究者 にとってはパワフルで便利なツールであった.オープンソースのプログラム言語による統計解析のもう 1 つの大きなハードルはプログラミングである.英語やドイツ語のように,1 から文法を習得していくのはとても時間がかかり,そのようなことに研究・教育の時間をとられるのはとても苦痛であった.

ChatGPT – 4 によって変わる世界観

ChatGPT – 4 の公開によって世界観は大きく変わったといってよい.統計解析においても,たとえば等分散を仮定した t 検定なら,データを JEPG にして ChatGPT – 4 に読み込ませ,「 文章で等分散を仮定した t 検定をしてください 』と依頼れば,統計解析した結果を返してくれるようになった.高価な市販ソフトの存在意義は大きく揺らぎつつある.一方,オープンソースのプログラム言語による統計解析ではもっと大きな変革が起こりつつある.たとえば,「 等分散を仮定した t 検定のコードを R で示してください 』 と入力すると,R スクリプトを示してくれる.つまり,プログラム言語であるR を習得することなく統計解析のプログラムをすることが可能になったのである.Python や R で統計解析のプログラミングが なんとかできる ということは,人材という用語から考えると,経済的な価値は ほとんどない 考えてよくなったのである.

ChatGPT – 4 のような文章生成 AI はホワイトカラーワーカーの仕事だけでなく,単に統計解析ができるだけというデータアナリストの仕事を奪っていくと考えている.なぜなら,ビジネスにかかる大きな負担は人件費だからである.経営者は,まず,人件費を削減することを考える.『 機械による工場のオートメーション化が進んでも,これらによって次の新しい仕事が生み出さた.したがって生成 AI が利用されるようになっても 新しい仕事が生まれる から問題はない 』 という意見がある.しかし,考え判断するという基本的な人間の機能が AI によって代替えされるのであるから,新しい仕事が生み出されるというのは 甘い考えと認識であると推察できる.文章生成 AI が登場するまでは,『 イラストや音楽などのクリエイティブな仕事は人間だけができる仕事として最後まで残る 』とされていた.最初に発表され自由に使えるようになったのは,イラスト作成や作曲のようなクリエイティブの生成 AI であった.このことは,人間による統計解析の仕事は AI に代価されることを暗示していると考える.

これから統計解析で必要とされること

「 司法試験,公認会計士,司法書士 ちょっと下がって弁理士資格 」弁理士見習い時代の先輩が弁理士試験の難易度を教えてくれた.かっては 試験が困難な資格をもっているだけで生活できる時代であったのである.しかし,現在はデータアナリシストだけでなく,すべの専門職では,(1) データ解析から導き出された結果について,その結果が意味すること深く考察すること,(2) その考察から導き出されることに対応できること が求められる .(1) および (2) に対応する具体的策としては,統計解析および統計解析結果の考察をできるだけ経験することではないかと考える.世の中に存在するあまたの資格と同じように 実務経験がないと統計解析でも社会では通用しない.

現在の 文章生成 AI は思考しているのでなく,特定のトークンのあとにくることの確率が高いトークンを並べるだけである.したがって,AI には自分の考えや意思があるのではないため,最終的な判断は人間がしなければ大きなミスを招くことになる.私たちは統計解析結果をより深く考察するという経験を可能な限り多く持つことによって AI に使われるのではなく,AI をコパイロットとして利用することを考えなければならないと考える.もっとも,AI の進歩は加速的に早くなっているので,このブログでお示ししたことも数年で訂正することになるであろう.そのときになったら,また,対処法を考えて行動することになる.鏡の国のアリスの世界のように『 全力疾走しないと同じ場所にとどまることができない世界 』に私たちは住んでいる.

まとめ

(1) 統計解析のプログラミングは ChatGPT – 4 によって飛躍的にハードルが低くなった.

(2) 文章生成 AI の間違いを理解するためには,統計解析とその結果を深く考察する機会を可能な限り多く持つことが必要である.