大規模言語モデルは好かれたいだけ

ByManagetech

1月 14, 2025

LLMs（Large Language Models）は、人々と同様に、好感を持たれるように見せようとする傾向がある
社会科学者は、社会的望ましさのバイアスに直面し、LLMsも同様の傾向を示すことが研究で明らかになっている
新論文では、LLMsに「大五人格」の性格特性に関する調査を行い、LLMsが社会的価値観に向かって回答を曲げる傾向があることを発見
このバイアスを軽減するためのアプローチも試みられたが、効果的な方法は限定的であることが示されている

自然言語処理モデルが人間の行動を理解するための心理学実験に使用されていることに驚いた。LLMsにおける社会的望ましさのバイアスは、これらのモデルを評価し、効果的に展開する際にさらなる課題を示しています。LLMsの振る舞いを理解し、予測するために心理学の知識を活用することが重要であり、さらなる研究が必要とされます。

元記事: https://hai.stanford.edu/news/large-language-models-just-want-be-liked