- 大規模言語モデル(LLM)を利用するAIツールは、患者の健康状態に関する説明に基づいて遺伝性疾患を正しく特定するのに苦労する。
- 研究チームは、LLMが教科書の記述や医師からの説明では疾患を特定できたが、一般の人からの説明ではできなかった。
- 研究では、ChatGPTの最新バージョンであるGPT-3.5とGPT-4など10種類のモデルを用いて遺伝性疾患の診断精度をテストした。
- モデルの診断精度は、テキストブックや一般的な言語で書かれた遺伝疾患の説明から患者の症状を記述したものまでテストされた。
- モデルは、一般の人々も利用できるようにする必要があり、AIツールは診察を待つことなく質問に答えるのに役立つ可能性がある。
この研究から、大規模言語モデルは教科書の記述や医師による症状の説明を正しく特定できるが、一般の人からの説明には苦労することが示されました。AIツールの臨床的な有用性を高めるためには、患者の多様性を反映したデータが必要であり、異なる人々が自身の状態についてどのように話すかを学習する必要があります。