月. 6月 22nd, 2026

OpenAI の o1 は問題の 83.3% を正しく解決しましたが、GPT-4o はわずか 13.4% でした | IBL ニュース

ByManagetech

9月 14, 2024

新しいOpenAIのo1推論モデルは、IMOの資格試験で83％のスコアを獲得し、GPT-4oはわずか13％の問題を正しく解決した。
コーディング能力は競技で評価され、Codeforces競技で89パーセンタイルに到達。
複雑な推論を行うために強化学習で訓練されたこの新しいLLMは、数学とコーディングに秀でており、回答する前に考えることができる。
OpenAIによると、物理学、化学、生物学の難しいベンチマーク課題で、PhD学生と同様のパフォーマンスを発揮。
o1はレート制限されており、o1-previewは週間制限が30メッセージ、o1-miniは50メッセージ。
追加のデメリットは高価な価格で、o1-previewのAPIは入力トークン1百万あたり15ドル、出力トークン1百万あたり60ドル。
OpenAIはo1-miniアクセスをChatGPTのすべての無料ユーザーに提供する予定で、リリース日は設定されていない。

自然言語処理の分野で新しいOpenAIのo1推論モデルは、数学やコーディングにおいて高い性能を示し、強化学習によって複雑な推論を行う能力を持っています。価格が高額であるというデメリットがあるものの、OpenAIの今後の展開が注目されます。

元記事: https://iblnews.org/openais-o1-correctly-solved-83-3-of-the-problems-while-gpt-4o-solved-only-13-4/

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

3月 18, 2025 Managetech

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech