单击此处查看如何将一张无用的照片变成可识别的面孔。 侦探吉姆·麦克莱兰按下按钮,嫌疑犯的模糊特写镜头——留着胡须、面无表情、目光不看镜头——从他的电脑显示器上消失了。代替二维视频静止图像的是虚拟头部,清晰呈现三维图像。麦克莱兰旋转并倾斜头部,直到嫌疑犯面朝前方,双眼直视屏幕。 这是一张小偷的脸,一名男子在费城郊区的一家便利店的过道上随意走动,用偷来的信用卡购物。警方追踪了这起非法交易,并从商店的监控摄像头中提取了图像。麦克莱兰第一次用面部识别软件运行它时,结果毫无用处。在远程服务器上运行的算法产生了数百个候选者,这些候选者来自该州已知罪犯的名录。但没有一个人与嫌疑人的资料足够相似,不足以进行进一步调查。 这并不完全令人惊讶。自 2007 年麦克莱兰和切尔滕纳姆镇警察局首次获得宾夕法尼亚州人脸匹配系统的使用权以来,人脸识别软件经常无法产生可操作的结果。虽然面部照片是面朝前方,但无论是在街上还是从天花板安装的监控摄像头拍摄的“野外”对象很少直视镜头。侦探已经习惯了死胡同。 但从 2012 年开始,州政府对系统进行了全面改革,并增加了姿势矫正软件,这使得麦克莱兰和其他受过训练的警官能够将嫌疑人的头部转向镜头。当我从警探的肩膀上看着他时,他调整好了小偷的脸部,重新提交了照片。屏幕上充斥着一排排的面部照片缩略图。麦克莱兰指出了排名第一的候选人——从数学上看,这张图像与提交的图像最相似。 匹配成功。侦探确信这一点,因为涉案嫌疑人去年因信用卡诈骗被捕并被判刑。麦克莱兰选择这次演示是为了向我展示新型面部识别软件的强大功能及其潜力:仅凭一张蹩脚的屏幕截图,他的郊区警察局现在就可以从 350 万张人脸的综合数据库中找出罪犯。 今年夏天,人脸识别软件的覆盖范围将进一步扩大。作为其下一代身份识别 (NGI) 计划的一部分,联邦调查局将在全国范围内开放超过 1600 万张嫌犯照片,地方和州警察局也将贡献数百万张。这是同类数据库中规模最大、最全面的数据库,它将把一个相对独特的调查工具转变为执法部门的广泛能力。没有内部人脸匹配软件的警官(绝大多数)将能够将图像提交给位于西弗吉尼亚州克拉克斯堡的联邦调查局服务器,那里的算法将返回 2 到 50 名候选人的排名列表。 这项耗资 12 亿美元的 NGI 项目已经收集了不止人脸数据。其存储的数据包括指纹和掌纹;虹膜扫描和声音模式等其他生物特征标记也可能被纳入其中。但人脸与大多数标记不同;它们可以在未经同意或没有专门设备的情况下被收集——任何照相手机都可以。这使得它们特别容易被滥用。如果说美国国家安全局 (NSA) 棱镜门丑闻有什么教训的话,那就是保护公民和侵犯公民隐私之间的界限很容易被模糊。在棱镜门丑闻中,该机构多年来监控了数百万个电子邮件账户。 因此,当 FBI 准备在全美范围内推广 NGI 时,理性的回答是:人脸识别能否创造一个更安全、更有保障的世界,减少悬案、失踪儿童和更多罪犯入狱?它能否在不终结我们所有人的匿名性的情况下做到这一点? *** 美国联邦调查局身份鉴定部门自 1924 年成立以来一直在收集罪犯的数据,最早使用的生物特征标记是指纹。该局最初收集的是零散的指纹,记录在无数叠沾满墨水的索引卡上,现在保存着大约 1.35 亿份数字化指纹。早期的法医专家必须用肉眼进行工作,将从犯罪现场提取的指纹的独特螺纹和弧线与已存档的指纹进行匹配。自 20 世纪 80 年代计算机开始自动进行指纹分析以来,原本可能长达数月的过程缩短到了几个小时。现在专家们称大多数指纹匹配为“熄灯”操作,即在人类回家睡觉时,计算机算法可以完成这项工作。 指纹不会长出胡子,DNA 也不会戴在太阳镜上。但随着时间的流逝,面部会长出毛发并下垂。 匹配算法很快就发展起来,使 DNA 检测、面部识别和其他生物特征分析成为可能。与指纹一样,联邦调查局经常带头收集新的生物特征标记(例如,在 1994 年建立了第一个国家 DNA 数据库)。DNA 分析涉及比较 13 个不同的染色体位置,可信度极高——99.99% 的匹配都是正确的。对于任何不完美的指纹,指纹分析的确定性都较低。联邦调查局表示,假设所有者的指纹已存档,则将潜在指纹(犯罪现场留下的通常很模糊或部分印记)与其数据库中的指纹正确匹配的概率为 86%。这并不意味着指认错误人的概率为 14%:DNA 和指纹分析都可以在法庭上采纳,因为它们产生的误报很少。 另一方面,面部识别永远不会确定对象——充其量,它只是为进一步调查提供线索。部分原因是脸是可变的。指纹不会长出胡子,DNA 也不会变成太阳镜。但随着时间和环境的变化,脸会长出毛发并下垂。人们也可能彼此相似,要么是因为他们有相似的特征,要么是因为低分辨率图像欺骗算法认为他们有相似的特征。 由于这些限制,包括 NGI 在内的任何系统都无法提供单一、确认的候选人,而是提供一系列潜在匹配。人脸匹配软件几乎总会给出某种答案,即使答案完全错误。NGI 项目经理 Kevin Reid 估计,高质量的探测器(即提交的照片的专业术语)大约有 80% 的时间会返回正确的一级候选人。但这种准确率具有欺骗性。它假设了像 McClelland 这样的警官很少能获得的那种图像。 在我访问切尔滕纳姆警察局期间,另一名侦探拿着一份打印件来到麦克莱兰的隔间。“你能用这个吗?”他问道。麦克莱兰几乎没看一眼视频静态画面——一片斑驳、表现主义的像素混乱——就摇了摇头。“我已经使用这个系统很多次了,我很清楚我是否应该尝试一下,”他说。每周他收到的几十张照片中,他可能会使用一两张。当他确实有确凿的证据时,很少是武装抢劫或袭击,也从来不是谋杀。 暴力罪犯往往会隐藏自己的脸,而且他们通常不会在公共场合犯罪。麦克莱兰说,如果摄像头碰巧拍到了犯罪行为,“他们正在快速奔跑或行走,而不是像在偷东西一样。”此时,面部识别最适合抓捕小偷小摸的罪犯。麦克莱兰说,当你的信用卡被盗并用于购买礼品卡和婴儿配方奶粉时——这两种东西都很受欢迎,因为它们的转售价值很高——匹配软件可能会帮上忙。 从某种程度上来说,提高面部识别技术的准确性并不在 FBI 的掌控之中。执法机构不会自行开发算法,他们花钱使用私营公司编写的专有代码,并资助学术界开发新方法。生物识别研究界有责任将面部识别技术变成一种真正强大的工具,一种值得围绕它展开辩论的工具。 *** 2011 年 8 月,伦敦爆发骚乱。骚乱最初是抗议警方开枪致人死亡,但很快升级,五天内纵火和抢劫猖獗。骚乱发生后,当局立即部署了据称为 2012 年夏季奥运会开发的面部识别技术。“当局拍摄了 6,000 张嫌疑人的照片,”德国公司 Cognitec 的营销经理 Elke Oberg 表示,该公司的算法被世界各地的系统所采用。“其中一张的角度和质量都足够好,可以运行。” 面部识别可能会受到很多因素的阻碍,从相机镜头上的污垢到拉低的棒球帽。但该技术最大的分析挑战通常可以用一个首字母缩略词来概括:APIER,即老化、姿势、照明、表情和分辨率。 正面面部照片提供了人的面部特征的二维图,使算法能够测量和比较面部特征之间的独特距离组合。但是,人脸的形态会随着年龄的增长而变化:下巴、下颌线和其他构成特定相似性边界的特征会扩大和收缩。姿势或表情的变化也会影响这些测量结果:头部倾斜会减少两眼之间的感知距离,而微笑会使嘴部扭曲并改变面部的整体形状。最后,光线不足和分辨率低的相机都容易使面部特征变得模糊。 在大多数情况下,生物识别研究人员通过训练软件来应对这些挑战,让每种算法都经历一系列无休止的搜索。而总部位于日本的 Cognitec 和 NEC 等公司则训练程序处理因图像质量不佳、角度过大或其他缺陷而产生的异常。这些升级取得了真正的进展。十年前,将对象与五年前的参考照片进行匹配意味着要克服 25% 的准确率下降,即每年 5%。如今,准确率下降幅度低至每年 1%。 计算机科学家现在正在利用配套软件来补充这些成果,这些软件可以减轻不良照片的影响并开辟一个巨大的新图像池。目前部署的最佳示例是 3D 姿势校正软件 ForensicaGPS,McClelland 在宾夕法尼亚州向我展示了这款软件。总部位于新罕布什尔州的 Animetrics 于 2012 年发布了这款软件,尽管该公司不愿透露确切数字,但全球执法机构都在使用它,包括纽约警察局和宾夕法尼亚州的全州网络。 在将二维图像转换为三维头像之前,McClelland 会调整各种十字准线,调整它们的位置,以便更好地与对象的眼睛、嘴巴、下巴和其他特征对齐。然后,该软件会创建一个详细的面部数学模型,捕捉标准二维中心算法遗漏或忽略的数据,例如鼻子和颧骨的长度和角度。Animetrics 首席执行官 Paul Schuepp 表示,它“大大提高了任何人的面部匹配系统的性能”。 社交媒体恰好拥有面部识别所需要的东西:数十亿张高质量的、面向摄像头的头像,其中许多与身份直接相关。 安尼尔·贾恩是全球顶尖的生物识别专家之一,他一直在密歇根州立大学 (MSU) 开发一种软件,可以完全消除对探测照片的需求。该软件名为 FaceSketchID,最明显的功能是将法医素描(由警察素描艺术家绘制的素描)与嫌犯照片进行匹配。贾恩说,它还可以使劣质视频片段变得可用。“如果你的画面质量很差或只有侧面,你可以绘制一张嫌犯的正面素描,然后将其输入我们的系统。” 换句话说,素描艺术家可以根据一张或多张模糊、倾斜或部分模糊的嫌疑犯视频剧照来创作肖像,而不是根据凶手的目击证人证言。可以将其视为手绘版的好莱坞风格图像增强,从昏暗的像素化脸部中提取细节。训练有素的艺术家可以进行图像修复,以适当的角度和光线重塑脸部,并突出其独特特征 - 浓密的眉毛或鹰钩鼻。然后可以将该绘图用作探测器,自动素描 ID 算法将尝试查找具有相应特征的照片。与艺术家对细节的关注相呼应,代码更少地关注寻找相似的综合面部图,而更多地关注突出的特征,挖掘相似的眉毛或鼻子。 截至发稿时,该系统刚刚完成,该系统自 2011 年开始开发,Jain 预计它将在几个月内获得许可。他领导的另一个项目涉及从红外视频中提取面部轮廓的算法——这种视频是监控团队或高端闭路电视系统使用的。酒类商店的盗贼不会面临被红外视频捕捉到的危险,但对于更有针对性的行动,例如追踪恐怖分子嫌疑人或在边境口岸监视他们,Jain 的算法可能意味着抓获一个引人注目的目标和仅仅记录另一个匿名旅行者之间的区别。联邦调查局帮助支持了这项研究。 单独来看,这些系统都无法解决面部识别的分析问题。解决方案往往伴随着警告和免责声明。例如,一种称为超分辨率的技术可以使图像的有效像素数增加一倍,但只有在比较以极快的速度连续拍摄的图像后才能实现。Animetrics 的一款名为 Vinyl 的新视频分析系统可以自动从镜头中提取面部并将其分类到文件夹中,将分析师一整天的工作变成 20 分钟的自动化任务。但分析师仍然必须一次将这些面部提交给匹配算法。其他研究将多帧视频拼接成更有用的复合配置文件,需要大量计算资源。 但综合起来,这些不同的系统将大大提高该技术的准确性。一些生物识别专家将今天的面部识别比作几十年前的指纹分析。一套标准将使它成为证据,即使真的能实现,也需要数年时间。但随着零散的突破有助于提高全面匹配性能,真正的全息面部识别的前景越来越近。这是承诺还是威胁,取决于谁的脸是可以识别的。 *** 到目前为止,麦克莱兰侦探在我访问期间拍摄的最佳照片是从社交媒体上截取的。为了进行面部识别,这张照片再完美不过了——近距离特写,光线明亮均匀。照片上也没有表情,这很合理。他从一名据称用枪威胁熟人的男子的个人资料中截取了这张照片。 这次,不再需要 Animetrics 的 3D 魔法。照片输入后,系统会给出排名第一、第二和第三的候选人,这些候选人的身份都相同(这些照片是在三次不同的逮捕中拍摄的)。该案涉及一名证人,他不知道嫌疑人的姓氏,但通过社交媒体与嫌疑人有联系。个人资料也没有提供姓氏,但有了前科犯的有力匹配,侦探就可以开始立案了。 我们上传的照片都是我们最美的一面,这是脸部匹配器梦寐以求的。Animetrics 表示,它可以对两眼之间只有 65 个像素的图像进行有效搜索。在视频监控静态照片中,眼睛之间的像素数为 10 或 20 是常见的,但即使是低分辨率的拍照手机照片也包含数百万像素。 社交媒体正好拥有面部识别所需要的东西:数十亿张高质量的、面向摄像头的头像,其中许多都与身份直接相关。谷歌和 Facebook 已经成为这项技术的孵化器。2011 年,谷歌收购了 PittPatt(匹兹堡模式识别的缩写),这是一家从卡内基梅隆大学分离出来的面部识别初创公司。一年后,Facebook 收购了以色列的 Face.com,并将其面部识别工作转向内部应用。这意味着关闭 Face.com 的 KLIK 应用程序,该应用程序可以扫描数码照片并自动用相应的 Facebook 好友的姓名标记它们。Facebook 后来推出了一项几乎相同的功能,称为标签建议。出于隐私方面的考虑,这家社交网络已在整个欧盟关闭了该功能。 与此同时,谷歌在很大程度上避免了争议。前首席执行官埃里克·施密特曾公开承认,该公司拥有提供面部识别搜索的技术能力。但由于明显的隐私风险,该公司选择不这样做。谷歌还禁止为其可穿戴计算硬件谷歌眼镜开发面部匹配应用程序。 Facebook 没有回应本文的采访请求,谷歌也拒绝了。但使用社交媒体巨头存储的图像进行面部识别并非想象中的威胁。2011 年,在 PittPatt 被谷歌收购后不久,卡内基梅隆大学隐私经济学家 Alessandro Acquisti 展示了一款概念验证应用程序,该应用程序使用 PittPatt 的算法通过将对象与 Facebook 图像进行匹配来识别对象。通过挖掘可在网上免费获取的人口统计信息,Acquisti 甚至可以为某些人分配社会安全号码。 部署一个全国性或全球性的同类系统,可以将探测器与一万亿或更多的图像进行匹配(而 Acquisti 的案例中只有几十万张),需要巨大的处理能力——对于硅谷的主导数据公司来说,这是有可能实现的,但目前还无法实现。“这并不意味着它不会发生,”Acquisti 说。“我认为这是不可避免的,因为计算能力随着时间的推移不断提高。人脸识别的准确性也越来越高。数据的可用性也在不断提高。” 所以这是一个噩梦般的场景:社交媒体会故意背叛我们,并称之为一项功能。阿奎斯蒂预测,最多 20 年内就会发生这种情况。但还有另一条不太遥远的途径可以访问 Facebook 和 Google 的数十亿张脸:当局可以简单地询问。“公司收集的任何信息,如果执法部门知道他们已经收集了,最终都会因某种目的而被传唤,”圣母大学计算机科学教授、生物识别和数据挖掘专家凯文·鲍耶 (Kevin Bowyer) 说。 问题不在于 Facebook 是否会将数据移交给执法部门。该公司曾提供特定账户访问权限以协助积极调查。它还被卷入了美国国家安全局 (NSA) PRISM 计划的漩涡,与其他公司一起被迫允许对其用户数据进行广泛监控。非营利性数字权利组织电子前沿基金会 (Electronic Frontier Foundation) 的高级律师詹妮弗·林奇 (Jennifer Lynch) 表示:“我们看到美国国家安全局的监控以及 FBI 获取记录的方式,很多记录来自私营公司。这些数据、图片都成了政府的诱饵。” 需要注意的是,FBI 不是 NSA。尽管通过关联或提前定罪很诱人,但并没有记录显示该机构越权或滥用生物特征数据。如果 NGI 的面部数据库确实存在,就像 FBI 反复描述的那样,是一个完全由面部照片组成的流氓画廊,那么它带来的隐私风险相对较小。 然而,“特征蔓延”——即人脸识别系统以隐秘、未经通知的方式整合新数据——已经发生。当我问麦克莱兰他是否可以根据 DMV 照片进行搜索时,我以为这是一个随口一问的问题。司机不是罪犯。麦克莱兰直视着我。“在宾夕法尼亚州?是的。” 多年来,警方一直有权访问 DMV 照片;他们可以通过姓名、位置或其他参数搜索数据库。但在 2013 年年中,他们获得了使用其他图像进行搜索的能力。现在,每次他们进行调查时,都会将其与宾夕法尼亚州交通部 (PennDOT) 数据库中超过 3000 万张驾照和身份证照片进行核对。麦克莱兰告诉我,他没有得到很多匹配结果,原因在于系统的底层算法。PennDOT 的首要任务不是追踪罪犯,而是防止创建重复的身份证。其系统有效地忽略了 DMV 办公室捕获的不是完美正面的调查。因此,最令人不安的广泛人脸收集案例之一,包括宾夕法尼亚州的大多数成年人——那些没有通过犯罪而放弃隐私,而只是申请州政府颁发的身份证明的人——因简单的数学选择而受阻。“我有点喜欢它,”麦克莱兰说。 “你不会收到很多错误回应。” 宾州交通部的照片对刑事调查能带来什么好处,谁也说不准。但有一点是肯定的:每年都有数千人试图越过联邦调查局承诺不会越过的底线——从搜查嫌犯的照片到搜查每个人。 *** 在人脸识别的许多潜在噩梦场景即将出现之际,这件事很容易就结束了。可靠的模式分析与全面的数据库不可避免地结合在一起,可能会产生网络惊悚片般的恐怖效果。或者,也许,它可以挽救局面。 去年 5 月,在波士顿马拉松爆炸案造成 3 人死亡、250 多人受伤一个月后,密歇根州立大学的 Anil Jain 发表了一项研究,揭示了可能发生的情况。Jain 使用在爆炸现场收集的监控图像,通过 NEC 的 NeoFace 算法对两名嫌疑人的脸部进行分析。尽管察尔纳耶夫哥哥塔梅尔兰实际上有一张面部照片,但由于 2009 年因殴打罪被捕,这张照片未能出现在前 200 名候选人中。他戴着墨镜和帽子,算法无法将其与他的入狱照片匹配。 焦哈尔·察尔纳耶夫则是另一回事。贾恩将弟弟毕业那天拍摄的一张照片放在了以面部照片为主的百万图像数据集中。在盲目搜索中(即没有年龄和性别等人口统计数据来缩小潜在候选人名单),NeoFace 将爆炸现场的照片与察尔纳耶夫毕业那天的照片配对,作为排名第一的结果。面部识别将在调查中提供最佳且基本上唯一的线索。 有个问题。参考照片最初发布在 Facebook 上。为了完成这项匹配,执法人员需要获得该社交网络人脸数据库的访问权限,该数据库分布在数万亿张或更多的图片中。爆炸发生三天多后,察尔纳耶夫兄弟谋杀了一名麻省理工学院的警察,并在剑桥和附近沃特敦的街道上进行了一场枪战,从而结束了调查。面部分析的时间很短,技术障碍可能是无法克服的。 尽管如此,它还是有可能起作用的。 也许现在就讨论人脸识别的界限还为时过早。毕竟,它最大的胜利和最严重的违规行为尚未到来。或者也许这太难了,因为这意味着要进行丑陋的计算,例如权衡集体隐私的成本与个人生命的代价。但也许这正是应该讨论变革性技术的时候和原因——趁现在还来得及。 你的身体会以四种方式背叛你1) 手指/掌纹:犯罪现场收集的潜在指纹包括手指和掌纹。两者都可以识别个人身份,但潜在印记往往模糊不清且不完整。去年 4 月,联邦调查局彻底改变了指纹分析方法,推出了首个全国掌纹数据库,并更新了算法,使指纹搜索的准确率提高了三倍。2) DNA****:将嫌疑人的 DNA 与犯罪现场样本进行比对,通常需要等待长达 60 天才能得到实验室结果。IntegenX 最近发布了 RapidHIT 技术,该技术可在 90 分钟内比对 DNA,速度快到足以在审讯期间确定嫌疑人。这款 2 英尺乘 2 英尺的扫描仪将实验室所需的化学分析数据整合到一个一次性微流体盒中。3) 虹膜:虹膜扫描要求嫌疑人直视附近的摄像头,因此对于刑事调查来说,虹膜扫描几乎毫无用处。但这是一种万无一失的身份验证方法,几乎任何消费级摄像头都可以捕捉到眼睛中的独特图案。学校、监狱和公司(包括谷歌)已经使用虹膜扫描来确保安全。4) 语音:尽管语音识别在很大程度上是一种商业工具(巴克莱等银行用它来核实汇款),但声音模式匹配也能抓到骗子。在通话 30 秒内,Nuance Communications 创建的系统可以构建独特的声纹,然后将其与已确认的诈骗犯的声纹数据库进行对比。面部识别面临的五大挑战1) 年龄:岁月对面部造成影响。同一主体的两张照片间隔越久,下颌线或鼻子变红的可能性就越大。许多其他特征也会随着年龄的增长而失去明显的相似性。 2) 姿势:大多数匹配算法会比较各种特征之间的距离,例如两眼之间的距离。但背对相机的拍摄对象可能会出现截然不同的相对测量值。 3)照明:昏暗的灯光、浓重的阴影甚至过高的亮度都可能产生同样不利的影响,使算法无法获得识别和比较多个特征所需的视觉细节。 4)表情:无论是张嘴大叫、咧嘴大笑还是抿嘴威胁,如果拍摄对象的表情与参考镜头中的表情不匹配,关键标志(如嘴巴的大小和位置)可能不会对齐。 5) 分辨率:大多数面部识别算法的优劣取决于照片中的像素数量。分辨率取决于相机质量、拍摄对象与镜头之间的距离(这决定了需要放大多少倍才能识别出面部)。 本文原载于《大众科学》杂志2014年版。 |
《老大哥不公平》——回顾大家的代表作歌曲《老大哥不狡猾》是1987年10月在NHK教育电视台(现为N...
《NEET豆吉豆子的日常生活》——带来治愈和欢笑的5分钟幸福《NEET豆吉豆子的日常生活》于2022...
土壤是日常生活中最重要的元素之一,即使没有被低估——它对于种植我们赖以生存的食物和资源、抗旱、防洪以...
战争的大部分目的都是为了不让人死亡。每一种新的杀人方法都有所发展,但也有其他精心设计的方法可以让脆弱...
《福星小子:障碍游泳大会》的魅力与评价■作品概要《福星小子:障碍游泳大会》是作为 2008 年 7 ...
本文摘自 2017 年最佳新品榜单。如需查看本年度最具变革性的产品和发现的完整列表,请点击此处。哈卡...
20 世纪 60 年代初,佛罗里达州的一位昆虫学家开始发表关于肥胖蚊子的研究,一些关于肥胖虫子的早...
Canva 是一款可在网页、桌面和移动设备上使用的图形设计软件包,它可以帮助您制作几乎任何东西:从网...
灾难发生后,社区会向联邦紧急事务管理局 (FEMA) 寻求庇护和物资。但为了清楚地了解情况有多糟,F...
流星机 Gakusaver - 龙星机 Gakusaver ■ 公共媒体卵子■ 原创媒体动漫原创■ ...
“舞蹈版”的魅力与评价1974年上映的动画电影《骚扰盘》以其独特的世界观和创新的叙事方式吸引了大批粉...
自然资源保护委员会 (NRDC) 最近的一项研究登上了头条新闻,该研究显示,家中耗能最大的设备可能不...
露营烹饪-大家的歌杰作《露营烹饪》是1963年6月在NHK教育电视台(现NHK E-Tele)播出的...
吓唬人并不难。只要拿一个看起来令人不安的物体,把它放在视线之外,直到合适的时机。然后,让它飞起来,发...
本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听 PopSci 的最新播客,你会得...