在过去十年的大部分时间里,各种研究小组一直在研究 AI 医生的想法。去年 12 月下旬,来自 Google 和 DeepMind 的计算机科学家推出了自己的 AI 临床医生版本,该版本可以使用名为 PaLM 的大型语言模型,根据患者的症状诊断患者的病情。 根据该团队发表的预印本论文,他们的模型在包含美国医师执照考试问题的基准测试中得分为 67.6%,他们声称这比之前最先进的软件高出 17%。其中一个版本的表现与人类临床医生的水平相似。但是,这种算法和其他类似的算法都存在很多问题。 以下是关于该模型的一些简要事实:该模型是在包含 3,000 多个常见医疗问题的数据集以及另外六个现有的开放医疗问题和答案数据集(包括医疗检查和医学研究文献)上进行训练的。在测试阶段,研究人员将两个版本的人工智能的答案与人类临床医生进行了比较,并评估了这些答案的准确性、真实性、相关性、有用性、与当前科学共识的一致性、安全性和偏见性。 谷歌 Chrome 软件工程师 Adriana Porter Felt 并未参与该论文的撰写,她在 Twitter 上指出,该模型的版本能够以与人类临床医生类似的方式回答医疗问题,这得益于“指令提示调整”这一附加功能,这是一个费力且无法扩展的人工过程。这包括以特定方式仔细调整问题的措辞,以使人工智能能够检索正确的信息。 [相关:谷歌正在对其健康信息服务方式进行重大更新] 研究人员甚至在论文中写道,他们的模型“表现令人鼓舞,但仍然不如临床医生”,并且该模型的“对[医学背景的]理解、知识回忆和医学推理随着模型规模和指令提示调整而提高”。例如,与人类相比,每个版本的人工智能都会以更高的比率遗漏重要信息并在其答案中包含不正确或不适当的内容。 语言模型在解析复杂度和数量更多的信息方面越来越好。它们似乎可以很好地完成需要科学知识和推理的任务。包括 SciBERT 和 PubMedBERT 在内的几个小型模型已经突破了语言模型的界限,可以理解充满行话和专业术语的文本。 但在生物医学和科学领域,有复杂的因素在起作用,还有许多未知数。如果人工智能错了,谁来为医疗事故负责?当算法的大部分工作都像黑匣子一样时,错误源头能追溯到哪里吗?此外,这些算法(程序员给计算机的数学指令)并不完善,需要完整和正确的训练数据,而这些数据并不总是适用于不同人群的各种情况。另外,购买和组织健康数据的成本可能很高。 在标准化的多项选择测试中正确回答问题并不能体现出你的智力。如果计算机面对的是真实的临床病例,它的分析能力可能会不足。因此,尽管这些测试在纸面上看起来令人印象深刻,但大多数人工智能尚未准备好部署。以 IBM 的 Watson AI 健康项目为例。即使投入了数百万美元,它仍然存在许多问题,而且在规模上不够实用或灵活(它最终崩溃并被分拆出售)。 谷歌和 DeepMind 确实意识到了这项技术的局限性。他们在论文中写道,要使该模型真正发挥作用,仍有几个领域需要开发和改进,例如将响应建立在权威、最新的医学来源的基础上,以及检测不确定性并有效地向人类临床医生或患者传达不确定性的能力。 |
>>: 梅赛德斯-奔驰承诺在全美安装 2,500 个电动汽车快速充电器
我们依赖杂货店在一年中的任何时候提供来自世界各地的农产品和食品。虽然我们已经习惯了在冬季中旬在东海岸...
iPad 2 上市仅一周多,网上订单就积压了 4-5 周,在全国任何一家商店几乎都不可能快速买到。即...
《供物语》的魅力与深度《注物语》是西尾维新“物语系列”的第六部,于2014年12月31日作为电视特别...
“失落之城”这个概念听起来可能像是一个古老的传说或电影情节,但世界上一些废弃的城市在不久前也曾繁华过...
《如何养育一个无聊的女友》——青春与创意的交汇故事《无趣女友的养成方法》是改编自丸户文秋轻小说的电视...
每天刷几次牙是预防英语词典中最令人讨厌的短语之一:蛀牙的最好方法之一。但在 Twitter 上,一些...
一架名为“埃尔维斯”的老式主力直升机的制造商正在将他们备受尊敬的飞行机器改造成一个自主机器人。飞机制...
如果你要找一只三英尺高的鹦鹉的化石,那很可能是在新西兰。这个岛国仍然充满了不寻常的标本,包括世界上唯...
年轻恒星形成时,会吸走周围的尘埃和气体,剩余物质旋转形成一个扁平的旋转圆盘。行星最初是圆盘上的小团块...
本文已更新。最初于 2019 年 12 月 4 日发布。 Twitter 是一种快速、流畅的方式,可...
风力涡轮机或飞机机翼上的细小划痕可能不引人注意,但如果不加以处理,则可能造成严重问题。现在,英国的一...
一个春天的早晨,泰德·金斯曼在路边捡到这个标本,他希望能拍到一张鳄龟的 X 光照片。但当他把龟放进 ...
异世界四重奏:异世界跨界创造新魅力《异世界四重奏》是一部于 2019 年播出的电视动画系列,是四部以...
黑客可以在瞬间暗杀他人是阴谋论中最受欢迎的观点。最新的例子是:上个月,年轻的记者迈克尔·黑斯廷斯在车...
海滩产卵的红鲑鱼 Jason Ching/华盛顿大学在阿拉斯加西南部努沙加克河孵化、生长并返回产卵的...