- 新しいOpenAIのo1推論モデルは、IMOの資格試験で83%のスコアを獲得し、GPT-4oはわずか13%の問題を正しく解決した。
 - コーディング能力は競技で評価され、Codeforces競技で89パーセンタイルに到達。
 - 複雑な推論を行うために強化学習で訓練されたこの新しいLLMは、数学とコーディングに秀でており、回答する前に考えることができる。
 - OpenAIによると、物理学、化学、生物学の難しいベンチマーク課題で、PhD学生と同様のパフォーマンスを発揮。
 - o1はレート制限されており、o1-previewは週間制限が30メッセージ、o1-miniは50メッセージ。
 - 追加のデメリットは高価な価格で、o1-previewのAPIは入力トークン1百万あたり15ドル、出力トークン1百万あたり60ドル。
 - OpenAIはo1-miniアクセスをChatGPTのすべての無料ユーザーに提供する予定で、リリース日は設定されていない。
 
自然言語処理の分野で新しいOpenAIのo1推論モデルは、数学やコーディングにおいて高い性能を示し、強化学習によって複雑な推論を行う能力を持っています。価格が高額であるというデメリットがあるものの、OpenAIの今後の展開が注目されます。
