要約:

  • OpenAIの最新のイノベーションはCriticGPTと呼ばれ、人間の意向に従うようにAIシステムを振る舞わせるために、人工知能モデルの出力のバグやエラーを特定するために構築されました。
  • CriticGPTはGPT-4 LLMを使用して構築され、コードの分析とエラーの特定において人間の同僚がAIモデルの出力を見直せるよう支援しました。
  • OpenAIの研究者はCriticGPTを訓練し、その結果、人間のコードレビューアーよりも優れた性能を示しました。また、CriticGPTは、人間が見落とす微妙なミスも特定できることを示しました。
  • さらに、OpenAIチームは新しい技術「Force Sampling Beam Search」を作成し、CriticGPTにより詳細な批評を書かせることができるようにしました。

考察:

OpenAIのCriticGPTは、人間のコードレビューアーよりも優れた性能を示し、AI生成コードの詳細な批評を行うことができる点が注目されます。また、CriticGPTは微妙なミスを特定できる能力を持っており、将来的には生成AIの次の進化段階に向けて進化していく可能性があります。ただし、CriticGPTには課題もあり、特定のコードのエラーから生じる不正確な出力を見つける点では効果的ですが、複数の異なるコード文字列にまたがるエラーには苦労することがあります。


元記事: https://siliconangle.com/2024/06/27/openais-criticgpt-uses-generative-ai-spot-errors-generative-ais-outputs/