ChatGPT(深層学習)
2023年08月18日
最近、生成AI技術の1つであるChatGPT関連の記事や文献を頻繁に見かけます。元々、AIの概念は1950年代に誕生、20年程前に深層学習(ディープラーニング)技術で、ニューラルネットワークと呼ばれる脳の学習モデルをコンピューターで再現させることが可能になると、囲碁やチェスなどの勝負事や、予測・分析などに用いられました。ここに、巨大なデータセットと深層学習機能を併せ持ち、かつ「計算量」「データ量」「パラメータ数」を大幅に増やした大規模言語モデル(LLM)という多言語化に対応できる各種機能が加わることで、一気にその実用性が増してきたのだと考えられます。
一方で、まだ解明されていない理論では説明できない性質があることも知られています。例えば「過学習」と呼ばれる未知のデータへ対応できないことや、データドリフト問題(何らかの原因でアウトプットと理論とのズレが生じ、信頼性・妥当性が薄れること)、ハルシネーショ問題(知ったかぶりといわれる偽回答のことで、わからないと回答せず無理にでも答えを出す幻覚に似た現象)、出典先の非明示(著作権侵害)など、今後の課題も残されています。
ここまで急速に普及が進んだ背景には、チャットによる利便性と先述の大規模言語モデル(LLM;Large Language Models)が大きな役割を果たしていると思われます。具体的には、米国の司法試験の模擬試験で上位10%にあたる水準の成績で合格したという研究結果が挙げられています。また、入社試験、卒業論文、履歴書(職務経歴書)などはS評価や似たり寄ったりのものができたり、子供や学生たちの学習方法にも何らかの影響がでることは間違いないと思います。それ以外でも、知的生産性を向上させるセカンド・ブレイン(デジタル版備忘録)として本当に重要な情報(1%程度といわれています)の蓄積・選別など、まだまだ課題はたくさんあると感じます。