• CriticGPTは、ChatGPTが作成したコードを批評し、コードのバグを指摘するためのニューラルネットワークベースのAIモデル。
  • GoogleのDeepMindの研究者は、LLMs(Large Language Models)は自己修正能力にはまだ至っていないと主張。
  • OpenAIは、GPT-4の一つであるCriticGPTを提供し、モデル全体の精度を向上させるためにミスを見つけて修正することができると主張。
  • CriticGPTは、ChatGPTが生成するコードの間違いに対する批評を記憶する第二のニューラルネットとして提案されている。
  • 研究者たちは、CriticGPTを訓練して、人間のフィードバックに基づいて批評を洗練させ、より高い承認スコアに近づけるようにしている。

私の考え:

AIモデルがコードのバグを見つけることで人間のチームを助ける結果は励みになりますが、AIがヘルプを提供する際の幻覚を避けることはできないようです。今後の研究で、より良いプロンプトが必要かもしれません。

元記事: https://www.zdnet.com/article/openai-proposes-a-second-neural-net-to-catch-chatgpts-code-mistakes/