• 同じ大規模言語モデルに基づくツールでも、ChatGPT、Perplexity、GitHub Copilotなどの違いがある
  • GitHub Copilotは、VS Codeに埋め込まれた状態でテストされ、2つのテストに合格し、2つに失敗
  • GitHub CopilotはWordPressプラグインを作成するテストに失敗
  • GitHub Copilotは、PHPコードのみを生成し、JavaScriptを生成しなかった
  • GitHub Copilotは、ドルとセントをテストするコードを修正するテストに合格
  • GitHub Copilotは、WordPressフレームワークのAPI呼び出しと関連する問題を正しく解決
  • GitHub Copilotは、AppleScript、Chromeオブジェクトモデル、およびKeyboard Maestroに関するスクリプトを作成する能力を示すことができる
  • GitHub Copilotは、Microsoft Copilotや他のAIよりも多くのテストに合格
  • GitHub Copilotは、半分のテストに失敗し、パフォーマンスが改善されることが期待される

私の考え:GitHub Copilotは多くのテストに合格し、特定の問題を解決する能力を示していますが、まだ改善の余地があります。将来的には、AIのパフォーマンスが向上することを期待しています。

元記事: https://www.zdnet.com/article/i-put-github-copilots-ai-to-the-test-its-mixed-success-at-coding-baffled-me/