Meta 尝试一种新的、更具“包容性”的 AI 训练数据集

Meta 尝试一种新的、更具“包容性”的 AI 训练数据集

随着 OpenAI 的 ChatGPT 和谷歌的 Bard 等公司的出现,科技行业领导者正在继续向消费者推销他们的(有时是有争议的)人工智能系统以及人工智能集成产品。 不过,许多隐私权倡导者和技术专家仍然对用于训练此类程序的海量数据集感到担忧,尤其是涉及数据同意和用户补偿、信息准确性以及算法强制的种族和社会政治偏见等问题。

Meta 希望通过周四发布的 Casual Conversations v2(其 2021 年 AI 视听训练数据集的更新)来帮助缓解其中的一些担忧。根据该公司的声明,在 11 月公开的文献综述的指导下,该数据对不同地理、文化、种族和身体人口统计数据中的人类受试者进行了更细致的分析。

[相关:不,人工智能聊天机器人(仍然)不具备感知能力。]

Meta states v2 是“一个更具包容性的公平性衡量数据集”,它来自七个国家/地区录制的 26,467 个视频独白,由来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国的 5,567 名付费参与者提供,他们还提供了年龄、性别和外貌等自我识别属性。尽管 Casual Conversations 的初始版本包含超过 45,000 个视频,但这些视频仅来自居住在美国的 3,000 多名个人,他们通过较少的指标进行自我识别。

解决人工智能中的算法偏见是该行业面临的一个关键障碍,因为该行业长期受到人工智能产品提供种族主义、性别歧视和其他不准确答案的困扰。 这很大程度上取决于算法是如何创建、培育和提供给开发人员的。

尽管 Meta 称 Casual Conversations v2 是向前迈出的重要一步,专家们仍然保持谨慎乐观的态度,并敦促继续审查硅谷似乎一头扎进人工智能生态系统的行为。

西北大学计算机科学教授、该校机器智能安全促进中心主任克里斯蒂安·哈蒙德 (Kristian Hammond) 在给PopSci的电子邮件中写道:“这是一个几乎一切都在进步的领域。”哈蒙德认为,Meta 更新后的数据集是该公司“坚实的一步”——尤其是考虑到过去的隐私争议——并认为其对用户同意和研究参与者劳动报酬的重视尤为重要。

“但改进并不是完整的解决方案。只是一步而已,”他警告说。

对于哈蒙德来说,一个主要问题仍然是,研究人员究竟是如何招募参与者参与第二版休闲对话的。“性别和种族多样性很好,但你还必须考虑收入和社会地位以及种族的更细微方面的影响,”他写道,并补充道,“任何自我选择的人群都可能存在偏见。”

[相关:联邦贸易委员会密切关注人工智能诈骗者。]

当被问及如何选择参与者时,Meta 人工智能通信团队的 Nisha Deo 通过电子邮件告诉PopSci ,“我可以告诉你,我们根据自己的要求聘请了外部供应商来招募参与者”,而这些供应商“根据当地数据收集的市场价值”来确定补偿率。

当被要求提供有关工资率的具体数字时,Meta 表示“不可能扩大到超出我们已经分享的范围”。

然而,Deo 还表示,Meta 有意在数据培养的每个步骤中融入了“负责任的机制”,包括与香港科技大学的学术合作伙伴合作对现有数据集方法进行全面的文献综述,以及为注释者提供全面的指南。“负责任的人工智能在构建这个系统时考虑到了道德考虑和公民权利,并将其作为资源开源,以增加人工智能的包容性,”她继续说道。

对于像哈蒙德这样的行业观察家来说,像 Casual Conversations v2 这样的改进是值得欢迎的,但还需要做更多的工作,尤其是当世界上最大的科技公司似乎正在进入人工智能军备竞赛的时候。“每个人都应该明白,这不是一个完整的解决方案。只是一些初步措施,”他写道。“我们必须确保我们不会过于关注这个非常明显的步骤……我们停止督促组织确保他们没有在未经同意的情况下收集数据。”

<<:  方程式赛车计划如何利用更可持续的燃料为赛车提供动力

>>:  解决计算机运行缓慢的 5 种简单方法

推荐阅读

您是否应该担心 Amazon Sidewalk 的隐私问题?是也不是。

如果您在家中使用亚马逊的 Echo 设备或 Tile 追踪器来查找钥匙等,请注意:一项有争议且有趣的...

我们可能永远无法发现恐龙的幽灵

《恐龙之谜》深入探究了“可怕蜥蜴”的秘密,以及让古生物学家彻夜难眠的所有问题。我们正处于历史上最大的...

见见绘制地球最深处地图的海洋地质学家

当唐恩·赖特在一个几乎坚不可摧的房间中坠入世界底部时,深不见底的海洋让她想起了浩瀚无垠的黑暗太空。在...

如何取消发送通过 Facebook 和其他应用发送的消息

遗憾的是,这种方法无法帮助你从各种通讯应用中取消发送消息。Pixabay人们可能出于很多原因想要取消...

见识一下暗物质中的黑马——神秘粒子

根据本周发表的两篇科学评论,一种行为类似波的微小粒子作为暗物质的解释正在逐渐被接受。被称为轴子的理论...

这款特价二合一产品只需 159.97 美元,即可购买两台 4K 智能无人机

截至 6 月 26 日,Ninja Dragon Phantom Eagle PRO 4K 与 Bl...

是时候让你的 Venmo 交易保持私密了

转账应用程序非常有用,这也是它们如此普遍的原因。但其中最受欢迎的 Venmo 有一个问题:通过为我们...

如何拯救雨林?别去打扰它。

本文最初由 Grist 发布。请在此订阅 Grist 的每周新闻通讯。当约翰尼·阿普尔西德走遍美国早...

机器大战米特·罗姆尼:人工智能如何解析政治言论

尽管有无数个糟糕的笑话,但政客本身并没有什么问题。他们当然是骗子,但这只能证明他们是人。政治也没有天...

Apple Watch Series 7 评测:生活更大

与之前的更新相比,Apple Watch 7 的功能单一。它拥有更大的显示屏,与其他与屏幕相关的调整...

如何制作椰奶

有时候我只想喝一杯椰奶,搭配一块饼干或一些派。不过,我不想买半加仑的椰奶,因为在过期之前我喝不完。所...

狐狸和火车:独特的故事和迷人的人物评论

《狐狸和火车》的魅力与历史:一部标志着动画黎明的作品1958年10月1日上映的《狐狸和火车》在动画史...

大学生用 AA 电池和 20 美元的微处理器建造了一颗卫星

用火箭将卫星送入轨道需要花费大量资金——具体来说,至少需要 5000 万美元。虽然这极大地限制了谁可...

《我们做朋友吧 [第 1 季]》的魅力与评价:深入挖掘友谊的故事

我们做个朋友吧 [第一季] - 《我们做个朋友吧(第一季)》详细评论与推荐概述《我们成为朋友吧 [第...

人工智能揭示了维苏威火山烧毁的古代卷轴的第一个彩色单词

公元 79 年维苏威火山爆发是历史上最严重的自然灾害之一,但当时的许多实际记录都无法获取。例如,位于...