- AIの最先端はマルチモーダルモデルで、テキストだけでなく画像など他のモダリティにも対応
- ChatGPTはテキストプロンプトから画像を生成できる
- ChatGPTは与えられた画像を変更する際に現在は失敗する
- ChatGPTは画像の理解能力を示し、適切な応答を見つけることができる
- ChatGPTは画像の簡略化に失敗し、手動モードで画像を反転させるなどの試みをする
ChatGPTは画像の要素に対する行動ができないため、画像の編集において失敗している。高次の概念に基づいた画像の組み立てができないことが原因である可能性がある。