• 大規模言語モデル(LLM)を活用したチャットボットは、強迫性障害(OCD)の診断において医療やメンタルヘルスの専門家を上回る診断精度を示す。
  • LLMは、OCDの臨床事例において医療やメンタルヘルスの専門家に比べて高い正確性を示し、ChatGPT-4は全てのOCD事例で完璧な診断結果を出した。
  • LLMの全体的な診断精度は96.1%であり、一部のLLMが他のメンタルヘルスプロバイダーよりも高い精度を示した。
  • LLMはOCDの診断において有用であり、精神保健診断の効率性と正確性向上に寄与する可能性がある。

LLMの診断の正確性と臨床推論がOCDにおいて評価された初の研究であり、LLMを臨床ケアに取り入れる利点と倫理的問題、リスクと利益の重み付けを行うためにはさらなる研究が必要である。

元記事: https://www.nature.com/articles/s41746-024-01181-x