月. 3月 16th, 2026

OpenAI の o1 は問題の 83.3% を正しく解決しましたが、GPT-4o はわずか 13.4% でした | IBL ニュース

ByManagetech

9月 14, 2024

OpenAIの新しいo1推論モデルは、IMOの資格試験で83%のスコアを獲得しました。
GPT-4oは、たった13%の問題しか正しく解決できませんでした。
コーディング能力は、コンテストで評価され、競技プログラミングの質問（Codeforces）コンテストで89パーセンタイルに達しました。
複雑な推論を行うために強化学習でトレーニングされたこの新しいLLMは、数学やコーディングで優れており、ユーザーに回答する前に長い内部思考連鎖を生成することができます。
OpenAIによると、物理学、化学、生物学の難しい基準タスクで博士課程の学生と同様のパフォーマンスを発揮します。

考察：o1は強力な推論モデルであり、数学やコーディングにおいて高いスコアを記録しています。しかし、利用制限があり、高価な価格設定が課題となっています。将来的にo1-miniを無料ユーザー向けに提供する予定ですが、リリース日は未定です。

元記事: https://iblnews.org/openais-o1-correctly-solved-83-3-of-the-problems-while-gpt-4o-solved-only-13-4/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech