虽然这个人工智能不是医生,但它的医疗诊断非常准确

虽然这个人工智能不是医生,但它的医疗诊断非常准确

在过去十年的大部分时间里,各种研究小组一直在研究 AI 医生的想法。去年 12 月下旬,来自 Google 和 DeepMind 的计算机科学家推出了自己的 AI 临床医生版本,该版本可以使用名为 PaLM 的大型语言模型,根据患者的症状诊断患者的病情。

根据该团队发表的预印本论文,他们的模型在包含美国医师执照考试问题的基准测试中得分为 67.6%,他们声称这比之前最先进的软件高出 17%。其中一个版本的表现与人类临床医生的水平相似。但是,这种算法和其他类似的算法都存在很多问题。

以下是关于该模型的一些简要事实:该模型是在包含 3,000 多个常见医疗问题的数据集以及另外六个现有的开放医疗问题和答案数据集(包括医疗检查和医学研究文献)上进行训练的。在测试阶段,研究人员将两个版本的人工智能的答案与人类临床医生进行了比较,并评估了这些答案的准确性、真实性、相关性、有用性、与当前科学共识的一致性、安全性和偏见性。

谷歌 Chrome 软件工程师 Adriana Porter Felt 并未参与该论文的撰写,她在 Twitter 上指出,该模型的版本能够以与人类临床医生类似的方式回答医疗问题,这得益于“指令提示调整”这一附加功能,这是一个费力且无法扩展的人工过程。这包括以特定方式仔细调整问题的措辞,以使人工智能能够检索正确的信息。

[相关:谷歌正在对其健康信息服务方式进行重大更新]

研究人员甚至在论文中写道,他们的模型“表现令人鼓舞,但仍然不如临床医生”,并且该模型的“对[医学背景的]理解、知识回忆和医学推理随着模型规模和指令提示调整而提高”。例如,与人类相比,每个版本的人工智能都会以更高的比率遗漏重要信息并在其答案中包含不正确或不适当的内容。

语言模型在解析复杂度和数量更多的信息方面越来越好。它们似乎可以很好地完成需要科学知识和推理的任务。包括 SciBERT 和 PubMedBERT 在内的几个小型模型已经突破了语言模型的界限,可以理解充满行话和专业术语的文本。

但在生物医学和科学领域,有复杂的因素在起作用,还有许多未知数。如果人工智能错了,谁来为医疗事故负责?当算法的大部分工作都像黑匣子一样时,错误源头能追溯到哪里吗?此外,这些算法(程序员给计算机的数学指令)并不完善,需要完整和正确的训练数据,而这些数据并不总是适用于不同人群的各种情况。另外,购买和组织健康数据的成本可能很高。

在标准化的多项选择测试中正确回答问题并不能体现出你的智力。如果计算机面对的是真实的临床病例,它的分析能力可能会不足。因此,尽管这些测试在纸面上看起来令人印象深刻,但大多数人工智能尚未准备好部署。以 IBM 的 Watson AI 健康项目为例。即使投入了数百万美元,它仍然存在许多问题,而且在规模上不够实用或灵活(它最终崩溃并被分拆出售)。

谷歌和 DeepMind 确实意识到了这项技术的局限性。他们在论文中写道,要使该模型真正发挥作用,仍有几个领域需要开发和改进,例如将响应建立在权威、最新的医学来源的基础上,以及检测不确定性并有效地向人类临床医生或患者传达不确定性的能力。

<<:  太平洋上的新雷达站将使美军能够监视地平线

>>:  梅赛德斯-奔驰承诺在全美安装 2,500 个电动汽车快速充电器

推荐阅读

在网络周期间,以不到 300 美元的价格购买这款翻新的 HP EliteBook

网络星期一(通常持续一周的促销活动,因此称为网络周)的最大好处是科技和电子产品的大量折扣。无论您是在...

为什么《大白鲨》的创作者后悔把鲨鱼作为怪物

在《我犯了一个大错误》系列中,PopSci 探索了各种不幸和误解,包括它们的耻辱和荣耀。凭借这两张不...

纽约市迈出在城市道路上推出自动驾驶出租车的第一步

美国人口最多的城市可能很快就会有数十辆自动驾驶汽车 (AV) 在熙熙攘攘的街道上穿梭,但它们必须由人...

“蓝色计划”旨在拍摄孪生地球的第一张快照

今天宣布的一项新任务旨在拍摄半人马座阿尔法星系统的照片,该系统拥有距离我们太阳系最近的两颗类太阳恒星...

《地狱犬:龙谷的死神》的魅力与评价:深刻的故事和壮观的战斗场景的透彻分析

《地狱犬:龙的命运》:宏大的奇幻与深刻的故事叙述的融合《圣战地狱犬:龙国的死神》是一部改编自 Gre...

观看:三只白头鹰随时可能孵化

所有人的目光都集中在两位新的鸟类网络名人和它们位于南加州的温馨家园上。三只白头鹰幼雏随时可能从它们位...

阵亡将士纪念日当天,您可以以 25 美元的价格购买 Microsoft Windows 11 Pro 许可证

对于电子产品来说,新的并不总是更好。但对于软件来说,情况并非如此——尤其是操作系统。如果你是一名 P...

太空风确实存在

20 多年前,研究人员提出地球磁层(受磁场控制的太空区域)内存在一种太空风,即带电粒子的稳定流动。经...

“Ichi Toilet”:从大家的歌曲中可以学到的感人故事和魅力

“一厕所”——回顾大家的歌的杰作《一厕所》是一部短篇动画电影,于 1981 年 10 月播出,属于 ...

《闪电外送 OVA》的魅力与评价:不容错过的特别版

Inazuma Delivery OVA - 欢迎来到闪电快递的世界Inazuma Delivery...

我们到达冥王星!新视野号下一步要做什么?

九年前,一艘钢琴大小的宇宙飞船离开地球,前往太阳系边缘的一个陌生世界。它飞越了熟悉的岩石行星轨道,飞...

彻底解析电影《Fate/kaleid liner Prisma☆Illya:雪下誓言》的刺激感和号召力!

《Fate/kaleid liner Prisma☆Illya:雪下誓言》——动人的高潮与新的旅程...

《猫咪寻梦记》的魅力与评价:猫迷必看的动画

“猫计划” - Nekokikaku - 评论和详情■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期...

六张图表显示为什么没有人谈论气候变化

如果你和普通美国人一样,你可能对气候变化感到某种程度的担忧。但你可能不会花很多时间谈论它。至少数据显...

阿波罗指令舱和服务舱如何分离?

服务舱可能为阿波罗任务提供了动力,但它从未打算返回地球。相反,它是阿波罗任务的主力。它为任务的神经中...