火. 3月 17th, 2026

「最先端のモデルはまだほとんどのタスクを解決できない」：ソフトウェアエンジニアの死は思ったほど早くは起こらないかもしれない – OpenAI の研究者は、コーディングタスクにおいて AI モデルが依然として人間に遅れをとっていることを発見 | ITPro

ByManagetech

3月 12, 2025

大規模な言語モデルは、原因を特定したり包括的な解決策を提供するのに苦労している。
OpenAIの研究によると、AIはソフトウェアエンジニアをまだ置き換えることができない可能性がある。
研究者は、AIの有効性を評価するために「SWE-Lancer」というベンチマークを作成し、技術の不足を指摘。
AIは問題の位置を特定する能力に優れているが、根本原因を見つけるのが苦手。
OpenAIのモデルo1とGPT-4o、およびClaudeの3.5 Sonnetモデルを比較した結果、全てのモデルが特定のユーザーインターフェース（UI）の問題を完全に解決できなかった。

自然言語処理の進化は驚異的であり、AIによるコーディングツールはソフトウェアエンジニアリングを効率的にする可能性があります。しかし、AI生成のコードには潜在的な欠陥があることに注意する必要があります。AIコーディングツールの利用が増加している中、潜在的なリスクや欠点について企業が検討すべき警告サインが多く存在しています。AIツールに過度に依存することは、人間のプログラマーのスキルを損なう可能性があり、AIツールと人間の入力が組み合わさることで最良の結果が得られるとされています。

元記事: https://www.itpro.com/software/development/frontier-models-are-still-unable-to-solve-the-majority-of-tasks-ai-might-not-replace-software-engineers-just-yet-openai-researchers-found-leading-models-and-coding-tools-still-lag-behind-humans-on-basic-tasks

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

3月 18, 2025 Managetech

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech