虽然这个人工智能不是医生,但它的医疗诊断非常准确

虽然这个人工智能不是医生,但它的医疗诊断非常准确

在过去十年的大部分时间里,各种研究小组一直在研究 AI 医生的想法。去年 12 月下旬,来自 Google 和 DeepMind 的计算机科学家推出了自己的 AI 临床医生版本,该版本可以使用名为 PaLM 的大型语言模型,根据患者的症状诊断患者的病情。

根据该团队发表的预印本论文,他们的模型在包含美国医师执照考试问题的基准测试中得分为 67.6%,他们声称这比之前最先进的软件高出 17%。其中一个版本的表现与人类临床医生的水平相似。但是,这种算法和其他类似的算法都存在很多问题。

以下是关于该模型的一些简要事实:该模型是在包含 3,000 多个常见医疗问题的数据集以及另外六个现有的开放医疗问题和答案数据集(包括医疗检查和医学研究文献)上进行训练的。在测试阶段,研究人员将两个版本的人工智能的答案与人类临床医生进行了比较,并评估了这些答案的准确性、真实性、相关性、有用性、与当前科学共识的一致性、安全性和偏见性。

谷歌 Chrome 软件工程师 Adriana Porter Felt 并未参与该论文的撰写,她在 Twitter 上指出,该模型的版本能够以与人类临床医生类似的方式回答医疗问题,这得益于“指令提示调整”这一附加功能,这是一个费力且无法扩展的人工过程。这包括以特定方式仔细调整问题的措辞,以使人工智能能够检索正确的信息。

[相关:谷歌正在对其健康信息服务方式进行重大更新]

研究人员甚至在论文中写道,他们的模型“表现令人鼓舞,但仍然不如临床医生”,并且该模型的“对[医学背景的]理解、知识回忆和医学推理随着模型规模和指令提示调整而提高”。例如,与人类相比,每个版本的人工智能都会以更高的比率遗漏重要信息并在其答案中包含不正确或不适当的内容。

语言模型在解析复杂度和数量更多的信息方面越来越好。它们似乎可以很好地完成需要科学知识和推理的任务。包括 SciBERT 和 PubMedBERT 在内的几个小型模型已经突破了语言模型的界限,可以理解充满行话和专业术语的文本。

但在生物医学和科学领域,有复杂的因素在起作用,还有许多未知数。如果人工智能错了,谁来为医疗事故负责?当算法的大部分工作都像黑匣子一样时,错误源头能追溯到哪里吗?此外,这些算法(程序员给计算机的数学指令)并不完善,需要完整和正确的训练数据,而这些数据并不总是适用于不同人群的各种情况。另外,购买和组织健康数据的成本可能很高。

在标准化的多项选择测试中正确回答问题并不能体现出你的智力。如果计算机面对的是真实的临床病例,它的分析能力可能会不足。因此,尽管这些测试在纸面上看起来令人印象深刻,但大多数人工智能尚未准备好部署。以 IBM 的 Watson AI 健康项目为例。即使投入了数百万美元,它仍然存在许多问题,而且在规模上不够实用或灵活(它最终崩溃并被分拆出售)。

谷歌和 DeepMind 确实意识到了这项技术的局限性。他们在论文中写道,要使该模型真正发挥作用,仍有几个领域需要开发和改进,例如将响应建立在权威、最新的医学来源的基础上,以及检测不确定性并有效地向人类临床医生或患者传达不确定性的能力。

<<:  太平洋上的新雷达站将使美军能够监视地平线

>>:  梅赛德斯-奔驰承诺在全美安装 2,500 个电动汽车快速充电器

推荐阅读

如何在不丢失信息的情况下更换手机

一款新智能手机(谷歌、苹果或其他制造商的产品)吸引了你的眼球,突然间,你的旧手机就不再适合你了。但不...

彻底解析电影《面包超人闪耀!冰之王国的香草公主》的魅力与情感!

电影《Go Go!面包超人闪耀!》彻底解析“冰岛香草公主”的魅力与感性“大胆试试吧!”面包超人闪耀!...

Android 10 正式推出——以下是值得探索的新功能

早在 5 月初,谷歌在 I/O 开发者大会上就宣布了其 Android 操作系统最新版本的一系列功能...

风力涡轮机留下云层并导致能源效率低下

在这张令人惊叹的照片中,云朵在 Horns Rev 海上风电场的风力涡轮机尾流中飘动。但英国剑桥大学...

Windows 有一个隐藏的剪贴板管理器——下面介绍如何找到它

复制和粘贴是我们日常计算中必不可少的一部分,我们大多数人都是自动完成的。但有时我们会出错——我们复制...

向摄像机捕捉到的最深栖息的鱼问好

一支来自澳大利亚和日本的科学家团队不需要超长的鱼竿就能捕获有史以来最深的鱼。只需要一台相机、一些鱼饵...

如何整理智能手机主屏幕

新年伊始是盘点、制定计划和让生活更有序的时候——如果你愿意,你可以将这种感觉延伸到每次解锁智能手机时...

评《火鸟:伊甸园之球》:史诗故事与唯美图像的融合

《不死鸟:伊甸园之宇宙》:手冢治虫的经典杰作焕发新生2023年9月13日,手冢治虫代表作“凤凰”系列...

《影日!第二部》的魅力与评价:超出期待的续作

“影日!第二弹”——从黑暗深渊中再次出现的暗影强者《影之实!Second》是改编自轻小说《我想成为影...

现在是唯一一次可以以 15 美元的价格获得山姆会员店会员资格和 10 美元礼品卡的机会

阵亡将士纪念日即将来临,你可能已经开始为要洗的碗碟、要购物和要准备的东西而感到压力。说到聚会,主人通...

《我在伊朗长大》:生动的艺术和深刻的主题

《我在伊朗长大》:一个女孩在混乱的伊朗生存的故事■作品概要《我在伊朗长大》是一部动画电影,故事背景设...

无人机周刊:怀孕鲸鱼、灾害测绘等

以下是本周无人机热门新闻汇总:无人机的军事、商业、非营利和娱乐应用。无人机理赔USAA 为数百万美国...

波音公司未能喘口气,因为其星际线飞船再次被推迟

波音星际航线(Boeing Starliner)是一艘太空舱,原定于 7 月发射,进行首次载人试飞,...

大多数人没有尾巴。那么我们为什么有尾巴的骨头呢?

二月份,我们将关注塑造我们、为我们提供氧气、为我们在海滩上长途散步提供能量的身体部位。骨头是真正的骨...

小海豹天生就有很强的节奏感

海豹是善于发声和音乐的动物。众所周知,小海豹会唱低音调来吸引注意力,它们喜欢吵闹的本领使它们有别于其...