水. 6月 24th, 2026

AIは腫瘍学のクイズで他のAIより優れているが、いくつかの間違いは有害となる可能性がある

ByManagetech

6月 22, 2024

要約と考察

要約:

最近の研究では、大規模言語モデル（LLMs）が医学腫瘍学の試験問題に対する正確さと安全性を評価
LLMsは医療の革新をもたらす可能性があり、広範なテキストコーパスでトレーニングされ、人間らしい回答をするように調整可能
LLMsは多様な医学知識をエンコードし、米国医師国家試験に合格する能力を示すが、専門分野によって性能が異なる
医学腫瘍学は急速に進化する知識と高い出版物量で特別な挑戦を提供
LLMsの評価によると、特許LLM 2は他のモデルを上回る85.0％の正答率を示し、特に最近の出版物の知識を必要とする質問で誤答が多かった

考察:

LLMsは医学腫瘍学の試験問題において優れた性能を示しましたが、特に新しい証拠を必要とするような質問で誤りがあることが確認されました。LLM 2は他のLLMsや先行モデルであるLLM 1を上回り、優れた正確性を示しました。LLMsの能力は向上していますが、情報検索の誤り、特に新しい証拠に関するものはリスクをもたらす可能性があります。最新の医学腫瘍学知識を維持するためには、LLMsの強化トレーニングと頻繁な更新が不可欠です。

元記事: https://www.news-medical.net/news/20240621/AI-outperforms-peers-in-medical-oncology-quiz-yet-some-mistakes-could-be-harmful.aspx

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech