OpenAI o1, 응급실 환자 진단 정확도 67%로 의사 상회
원제: OpenAI's o1 correctly diagnosed 67% of ER patients vs. 50-55% by triage doctors
왜 중요한가
응급의료 분야에서 AI가 인간 의사를 능가한 첫 사례로 의료 AI 실용화에 중요한 이정표가 될 전망이다.
하버드 연구진이 보스턴 병원 응급실 환자 76명을 대상으로 진행한 실험에서 OpenAI o1 AI 모델이 67% 진단 정확도를 기록해 인간 의사의 50-55%를 앞질렀다고 발표했다. 특히 신속한 판단이 필요한 응급 분류 상황에서 AI의 우위가 두드러졌다.
하버드대 연구진이 응급의학 분야에서 AI와 인간 의사의 성능을 비교한 획기적인 연구 결과를 Science 저널에 발표했다. 보스턴 병원 응급실에 도착한 환자 76명을 대상으로 한 실험에서 OpenAI의 o1 추론 모델은 67%의 진단 정확도를 보였으며, 이는 인간 의사들의 50-55%를 상회하는 수치다. AI와 의사들은 동일한 전자건강기록을 제공받았으며, 이는 일반적으로 생체징후 데이터, 인구통계학적 정보, 간호사의 간단한 소견을 포함한다. 더 자세한 정보가 제공된 경우 AI의 정확도는 82%까지 상승했으나, 전문의들의 70-79% 정확도와 통계적으로 유의한 차이는 없었다. 연구진은 대규모 언어모델이 '임상 추론의 대부분 기준을 능가했다'며 이를 의학 분야를 재편할 기술 변화라고 평가했다. 독립 전문가들은 이 결과를 AI 임상 추론의 '진정한 진전'이라고 평했다.