• 新しいOpenAIのo1推論モデルは、IMOの資格試験で83%のスコアを獲得し、GPT-4oはわずか13%の問題を正しく解決した。
  • コーディング能力は競技で評価され、Codeforces競技で89パーセンタイルに到達。
  • 複雑な推論を行うために強化学習で訓練されたこの新しいLLMは、数学とコーディングに秀でており、回答する前に考えることができる。
  • OpenAIによると、物理学、化学、生物学の難しいベンチマーク課題で、PhD学生と同様のパフォーマンスを発揮。
  • o1はレート制限されており、o1-previewは週間制限が30メッセージ、o1-miniは50メッセージ。
  • 追加のデメリットは高価な価格で、o1-previewのAPIは入力トークン1百万あたり15ドル、出力トークン1百万あたり60ドル。
  • OpenAIはo1-miniアクセスをChatGPTのすべての無料ユーザーに提供する予定で、リリース日は設定されていない。

自然言語処理の分野で新しいOpenAIのo1推論モデルは、数学やコーディングにおいて高い性能を示し、強化学習によって複雑な推論を行う能力を持っています。価格が高額であるというデメリットがあるものの、OpenAIの今後の展開が注目されます。

元記事: https://iblnews.org/openais-o1-correctly-solved-83-3-of-the-problems-while-gpt-4o-solved-only-13-4/