要約:

  • AIモデルは高い精度を持つものの、患者教育には複雑すぎる説明を提供する傾向があり、効果が低い。
  • LLM(大規模言語モデル)は医学に影響を与え、特に皮膚科やMohs顕微鏡手術(MMS)のような専門分野での情報提供に使われる。
  • 患者向けのMMSに関する回答の品質を評価する研究が行われ、ChatGPT 3.5やGoogleのBard(現在はGemini)などが比較された。
  • ChatGPTとGoogle Bard/Geminiは適切性の承認率が高く、Google Searchの回答は承認されることが少なかった。
  • ChatGPTは最も高い平均正確性スコアを達成し、Google Bard/Geminiとほぼ同等であった。
  • Google Bard/Geminiは明らかにChatGPTやGoogle Searchよりも適切性承認率が高かった。

考察:

この研究は、AIモデルが患者教育のための有用なツールとしてどのように機能するかを評価しました。ChatGPTやGoogleのBard/Geminiは適切性や正確性において高い評価を受けましたが、患者が理解するレベルを超える複雑さが課題であることが示唆されました。AIの医療への慎重な導入と改善が必要であり、信頼性と患者にやさしい成果を確保するために、検証、標準化、LLM開発者との協力が重要であることが強調されています。

元記事: https://www.dermatologytimes.com/view/study-shows-ai-offers-mixed-results-in-mohs-education