- OpenAIがo3という新しい大規模言語モデルを発表
- o3は12日間の製品発表シリーズの締めくくりであり、以前に新しいChatGPTプランをローンチした
- o3は様々な推論タスクで前のモデルよりも大幅な改善を示す
- ARC-AGI-1というベンチマークでo3は75.7%のスコアを獲得し、前のモデルを大きく上回る
- o3はFrontier Mathテストでも記録的なパフォーマンスを達成、難しい数学問題を解くことに成功
- o3はプログラミングにも適用可能で、SWE-Bench Verifiedベンチマークで前世代のo1モデルを22.8%上回る
- o3はo3とo3-miniの2つのバージョンで利用可能で、o3-miniはより軽量なバージョン
- o3は初めは限られたAI安全性とサイバーセキュリティの研究者にのみ利用可能で、フィードバックを受けてモデルの安全性を向上させる
- OpenAIはo3を開発する際に有害な出力を防ぐ新しい技術である”deliberative alignment”を使用
自分の考え:o3は今後のAIの発展において重要な存在であり、さまざまな推論タスクで前のモデルよりも高いパフォーマンスを示しています。特にARC-AGI-1やFrontier Mathテストでの記録的な結果は注目に値します。また、AIの安全性向上のための取り組みも評価されるべきであり、今後の発展に期待が持てる内容です。