在最近发表在《美国医学会杂志》(JAMA)上的一项实验中,贝斯以色列女执事医疗中心(BIDMC)的医师研究人员测试了一个众所周知的公开聊天机器人在具有挑战性的医疗案例中做出准确诊断的能力。该团队发现,生成式人工智能Chat-GPT4在将近40%的时间内选择了正确的诊断作为其首要诊断,并在三分之二的具有挑战性的病例的潜在诊断列表中提供了正确的诊断。
生成式人工智能是指一种人工智能,它使用经过训练的模式和信息来创建新内容,而不是简单地处理和分析现有数据。生成人工智能的一些最著名的例子是所谓的聊天机器人,它使用人工智能的一个分支,称为自然语言处理(NLP),允许计算机理解、解释和生成类似人类的语言。
生成式AI聊天机器人是强大的工具,有望彻底改变创意产业、教育、客户服务等。然而,人们对它们在临床环境中的潜在表现知之甚少,例如复杂的诊断推理。
“人工智能的最新进展催生了生成式AI模型,这些模型能够做出基于文本的详细回答,在标准化体检中得分很高,”医学博士、公共卫生硕士、媒体和教育交付创新联合主任AdamRodman说(iMED)BIDMC的倡议和哈佛医学院的医学讲师。
“我们想知道这样的生成模型是否可以像医生一样‘思考’,所以我们要求一个人解决用于教育目的的标准化复杂诊断案例。它确实非常非常好。”
为了评估聊天机器人的诊断技能,Rodman及其同事使用了临床病理学病例会议(CPC),这是一系列复杂且具有挑战性的患者病例,包括相关的临床和实验室数据、影像学研究以及发表在新英格兰医学杂志上用于教育目的的组织病理学结果.
在评估70个CPC病例后,人工智能在27个(39%)病例中与最终的CPC诊断完全匹配。在64%的病例中,最终的CPC诊断包含在AI的鉴别诊断中——一份可能的病症列表,可以解释患者的症状、病史、临床发现以及实验室或影像学结果。
“虽然聊天机器人无法取代训练有素的医疗专业人员的专业知识和知识,但生成人工智能是诊断中人类认知的一种有前途的潜在辅助手段,”第一作者、医学博士、公共卫生硕士、BIDMC的住院医生和哈佛大学医学助理教授ZahirKanjee说。医学院。
“它有可能帮助医生理解复杂的医疗数据,并拓宽或完善我们的诊断思维。我们需要对这项技术的最佳用途、好处和局限性进行更多研究,并且需要解决很多隐私问题,但这些对未来的诊断和病人护理来说是令人兴奋的发现。”
“我们的研究增加了越来越多的文献,证明了AI技术的有前途的能力,”共同作者、BIDMC的内科医师和哈佛医学院的医学讲师ByronCrowe医学博士说。
“进一步的调查将帮助我们更好地了解这些新的人工智能模型如何改变医疗保健服务。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!