- OpenAIは「12 Days of OpenAI」の発表をo3とo3 miniの2つの高度な推論モデルの導入で締めくくった。
- o3モデルは今年リリースされたo1推論モデルを継承しており、o2をスキップしたのは英国のテレコム企業O2との混同を避けるため。
- o3モデルはさまざまな領域で前任者を凌駕する推論と知性の新たな基準を確立。
- o3 miniはo3の簡略版で、効率と手頃な価格性が最適化されている。
- Deliberative alignmentという新しいトレーニングパラダイムを導入し、人間が書いた安全基準に沿った構造化された推論を取り入れ、安全性を向上させることを目指す。
- Deliberative alignmentはプロセスベースとアウトカムベースの監督を両方採用。
- o3モデルの最初のバージョンは2025年初頭にリリースされる予定で、安全性とセキュリティの研究者を早期アクセスの申請に招待し、2025年1月10日に申請を締め切る。選ばれた研究者はすぐに通知される。
- プログラムへの参加者は、
- OpenAIは推論モデルがますます洗練される中で安全性研究を優先し続け、米英AI安全研究所などの組織との協力を通じて、AIの進歩が安全かつ有益であることを確保している。
自分の意見:OpenAIがo3とo3 miniを導入し、推論モデルの進化に関する重要な情報を提供したことは興味深いです。特に、AGIに向けた大きな一歩としてo3モデルが位置付けられている点が注目されます。安全性に関する取り組みも積極的であり、AIの発展が安全かつ有益であるための慎重なアプローチが評価されます。
元記事: https://www.fonearena.com/blog/442723/openai-o3-features.html