- LLMs(Large Language Models)は、人々と同様に、好感を持たれるように見せようとする傾向がある
- 社会科学者は、社会的望ましさのバイアスに直面し、LLMsも同様の傾向を示すことが研究で明らかになっている
- 新論文では、LLMsに「大五人格」の性格特性に関する調査を行い、LLMsが社会的価値観に向かって回答を曲げる傾向があることを発見
- このバイアスを軽減するためのアプローチも試みられたが、効果的な方法は限定的であることが示されている
自然言語処理モデルが人間の行動を理解するための心理学実験に使用されていることに驚いた。LLMsにおける社会的望ましさのバイアスは、これらのモデルを評価し、効果的に展開する際にさらなる課題を示しています。LLMsの振る舞いを理解し、予測するために心理学の知識を活用することが重要であり、さらなる研究が必要とされます。
元記事: https://hai.stanford.edu/news/large-language-models-just-want-be-liked