- 大規模言語モデル(LLM)を用いた人工知能(AI)システムが生命科学の多くのタスクで優れた性能を発揮している
- LLMは学生の評価スコアと比較して、大規模なオンライン導入コースでのパフォーマンスを評価
- LLMはMCQや最終試験の質問に回答し、全体的に50〜75パーセンタイルのスコアを獲得
- LLMの成功は、高等教育の学生評価の未来についての懸念を引き起こしており、将来の学生評価に影響を及ぼす可能性がある
この研究はLLMのパフォーマンスを評価し、生物医学および健康情報学の導入コースでの学生の成績と比較。最高のLLMシステムは、専門大学院、継続教育、医学生を含む学生の約3/4のパフォーマンスを上回った。
元記事: https://www.nature.com/articles/s41746-024-01251-0