- 2024年3月に、複数のLLMの共感能力を比較するベンチマークを公開
- 新しいモデルの登場とともに、ChatGPT、Llama、Gemini、Claudeのアップグレードなど、大きな進歩
- LLMの共感能力に影響を与える要因を探るため、発話応答の使用やプロンプトの改良、ヒューストン大学との協力による形式的研究を実施
自身のQ3の調査結果の要約を提供
- ChatGPT 4.0、1.0、Claude 3+、Gemini 1.5、Hume 2.0、Llama 3.1をカバー
- Emyのアプローチを使用して構成されたモデルと生のモデルの両方をテスト
- 新しい測定指標であるApplied Empathy Measure(AEM)を導入
感想:
- AIの共感能力を測定する試みや新たな指標の導入など、AIの感情理解に関する研究は重要であると感じる。
- 性別による共感能力の差やシステマイズ傾向がAIに影響を与えることが示唆されており、AIの進化を考える上で興味深い結果だ。
元記事: https://hackernoon.com/testing-the-depths-of-ai-empathy-q3-2024-benchmarks