月. 6月 29th, 2026

Claude 3.5 Sonnet を AI コーディングテストに対抗させたところ、ChatGPT は合格しましたが、創造性に欠ける結果になりました | ZDNET

ByManagetech

6月 28, 2024

AnthropicからClaude 3.5 Sonnetが利用可能というメールを受け取った
Claude 3.5 Sonnetは、競合するモデルやClaude 3 Opusを凌駕し、知能の業界基準を引き上げると述べている
Claude 3.5 Sonnetは、コード生成などの複雑なタスクに最適とされている
AIのテストを実施し、Claude 3.5 Sonnetの結果を他のAIモデルと比較した
Claude 3.5 Sonnetは、AIが二つのデータフィールドを横並びに配置するなど、斬新なアプローチを示した
一部ではクールな機能も見られたが、セキュリティ上の懸念も浮上
特定のテストでClaude 3.5 Sonnetは機能しない結果となった
コード修正に関するテストでは、成功と失敗の両方があった
WordPressプラットフォームに関する知識が必要なバグを正しく修正した
特殊なプログラミングツールに関する知識が不足し、テストに合格できなかった
結果的に、Claude 3.5 Sonnetはプログラミングには適していないという結論に至った

私の考え: Claude 3.5 Sonnetは一部では革新的なアプローチを示していたが、セキュリティ上の懸念やプログラミング知識の不足が目立った。ChatGPTなど他のモデルと比較しても、プログラミングには適していないように感じる。今後、プログラミングを支援するAIに期待したいが、現時点ではChatGPTが依然として優れている印象を受ける。

元記事: https://www.zdnet.com/article/i-pitted-claude-3-5-sonnet-against-ai-coding-tests-chatgpt-aced-and-it-failed-creatively/

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

3月 18, 2025 Managetech

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech