• OpenAIの新しいo1推論モデルは、IMOの資格試験で83%のスコアを獲得しました。
  • GPT-4oは、たった13%の問題しか正しく解決できませんでした。
  • コーディング能力は、コンテストで評価され、競技プログラミングの質問(Codeforces)コンテストで89パーセンタイルに達しました。
  • 複雑な推論を行うために強化学習でトレーニングされたこの新しいLLMは、数学やコーディングで優れており、ユーザーに回答する前に長い内部思考連鎖を生成することができます。
  • OpenAIによると、物理学、化学、生物学の難しい基準タスクで博士課程の学生と同様のパフォーマンスを発揮します。

考察:o1は強力な推論モデルであり、数学やコーディングにおいて高いスコアを記録しています。しかし、利用制限があり、高価な価格設定が課題となっています。将来的にo1-miniを無料ユーザー向けに提供する予定ですが、リリース日は未定です。

元記事: https://iblnews.org/openais-o1-correctly-solved-83-3-of-the-problems-while-gpt-4o-solved-only-13-4/