ハーバード大学研究、AI診断が救急医より高精度

原題: In Harvard study, AI offered more accurate diagnoses than emergency room doctors

なぜ重要か

医療AIの実用化において重要な節目となる研究結果で、診断支援技術の発展を示している

ハーバード大学医学部とベスイスラエル病院の研究チームが、OpenAIのAIモデルo1と4oの診断精度を救急医と比較する研究を実施。救急外来の患者76例で、o1モデルが67%の症例で正確または近似診断を提供し、医師の50-55%を上回った。研究結果はScience誌に掲載された。

ハーバード大学医学部とベスイスラエル・ディーコネス医療センターの医師と計算機科学者による研究チームが、大規模言語モデルの医療診断能力を評価する研究を実施した。研究結果は今週Science誌に掲載された。研究では、ベスイスラエル病院の救急外来を受診した患者76例を対象に、2名の主治医による診断とOpenAIのo1および4oモデルが生成した診断を比較。評価は、診断の出所を知らされていない別の2名の主治医が行った。結果として、o1モデルは各診断段階で2名の主治医と同等以上の性能を示した。特に最初の診断段階(救急初期トリアージ)において差が顕著で、患者情報が最も少なく迅速な判断が求められる状況でo1モデルが優位性を発揮した。o1モデルはトリアージ症例の67%で正確または非常に近い診断を提供し、一方の医師は55%、もう一方は50%の精度だった。研究チームは、AIモデルに事前処理を一切行わず、診断時点で電子医療記録に記録されていた情報と同じものを提示したと強調している。研究の筆頭著者であるアルジュン・マンライ氏は、AIモデルがあらゆる基準で以前のモデルと医師のベースラインを上回ったと述べた。ただし、研究チームはAIが救急室での実際の生死に関わる決定を下す準備ができているとは主張せず、実際の患者ケア環境でこれらの技術を評価する前向き試験の緊急な必要性を指摘している。

出典

techcrunch.com — 元記事を読む →