- OpenAIが「reasoning-heavy」な数学、コーディング、科学などのタスクに最適化された新しいAIモデルファミリーであるo1を発表
- OpenAI o1-previewおよびその軽量版であるOpenAI o1-miniは、「chain of thought」推論を使用してプロンプトに回答
- 「o1」は、OpenAIが少なくとも昨年から取り組んでいる極秘AIプロジェクト「Strawberry」の公開名
- o1モデルはまだプレビュー段階だが、AGIへのOpenAIの道の重要な一歩を表す
- o1は複雑な数学、化学、物理学、生物学の問題を解く際に人間の専門家と同等の性能を持つとされる
- o1は競技プログラミングの質問で89パーセンタイルにランクインし、物理学、生物学、化学の問題のベンチマークで人間のPhDレベルの精度を超える
- o1はAIシステムが自らのセキュリティと責任ある使用に関する保護措置を破るよう設計されたジェイルブレイク攻撃に対処する能力が向上している
- o1には欠点があり、o1-previewはまだ機能が完全ではない
- OpenAIはモデルを改善するための定期的なアップデートを予定している
- o1-previewとo1-miniは現在、ChatGPT PlusおよびTeamユーザーに利用可能であり、ChatGPT EnterpriseおよびEduユーザーは来週にアクセスを得る予定
自己学習や複雑な問題解決に特化したOpenAIのo1は、人間の専門家と同等の性能を持つことが期待されています。また、ジェイルブレイク攻撃に対処する能力も向上しており、安全性と整合性の向上に貢献すると考えられています。