- OpenAIの新しいo1推論モデルは、IMOの資格試験で83%のスコアを獲得しました。
- GPT-4oは、たった13%の問題しか正しく解決できませんでした。
- コーディング能力は、コンテストで評価され、競技プログラミングの質問(Codeforces)コンテストで89パーセンタイルに達しました。
- 複雑な推論を行うために強化学習でトレーニングされたこの新しいLLMは、数学やコーディングで優れており、ユーザーに回答する前に長い内部思考連鎖を生成することができます。
- OpenAIによると、物理学、化学、生物学の難しい基準タスクで博士課程の学生と同様のパフォーマンスを発揮します。
考察:o1は強力な推論モデルであり、数学やコーディングにおいて高いスコアを記録しています。しかし、利用制限があり、高価な価格設定が課題となっています。将来的にo1-miniを無料ユーザー向けに提供する予定ですが、リリース日は未定です。