- 新しいOpenAIのo1推論モデルは、IMOの資格試験で83%のスコアを獲得し、GPT-4oはわずか13%の問題を正しく解決した。
- コーディング能力は競技で評価され、Codeforces競技で89パーセンタイルに到達。
- 複雑な推論を行うために強化学習で訓練されたこの新しいLLMは、数学とコーディングに秀でており、回答する前に考えることができる。
- OpenAIによると、物理学、化学、生物学の難しいベンチマーク課題で、PhD学生と同様のパフォーマンスを発揮。
- o1はレート制限されており、o1-previewは週間制限が30メッセージ、o1-miniは50メッセージ。
- 追加のデメリットは高価な価格で、o1-previewのAPIは入力トークン1百万あたり15ドル、出力トークン1百万あたり60ドル。
- OpenAIはo1-miniアクセスをChatGPTのすべての無料ユーザーに提供する予定で、リリース日は設定されていない。
自然言語処理の分野で新しいOpenAIのo1推論モデルは、数学やコーディングにおいて高い性能を示し、強化学習によって複雑な推論を行う能力を持っています。価格が高額であるというデメリットがあるものの、OpenAIの今後の展開が注目されます。