GitHub Copilot の AI をテストしてみた – コーディングの成功と失敗が入り混じり、困惑 | ZDNET

2月 15, 2025

同じ大規模言語モデルに基づくツールでも、ChatGPT、Perplexity、GitHub Copilotなどの違いがある
GitHub Copilotは、VS Codeに埋め込まれた状態でテストされ、2つのテストに合格し、2つに失敗
GitHub CopilotはWordPressプラグインを作成するテストに失敗
GitHub Copilotは、PHPコードのみを生成し、JavaScriptを生成しなかった
GitHub Copilotは、ドルとセントをテストするコードを修正するテストに合格
GitHub Copilotは、WordPressフレームワークのAPI呼び出しと関連する問題を正しく解決
GitHub Copilotは、AppleScript、Chromeオブジェクトモデル、およびKeyboard Maestroに関するスクリプトを作成する能力を示すことができる
GitHub Copilotは、Microsoft Copilotや他のAIよりも多くのテストに合格
GitHub Copilotは、半分のテストに失敗し、パフォーマンスが改善されることが期待される

私の考え：GitHub Copilotは多くのテストに合格し、特定の問題を解決する能力を示していますが、まだ改善の余地があります。将来的には、AIのパフォーマンスが向上することを期待しています。