谷歌宣布推出 Gemini,这是 ChatGPT 的“多模式”解决方案

谷歌宣布推出 Gemini,这是 ChatGPT 的“多模式”解决方案

周三,谷歌宣布推出 Gemini,这是该公司 AI 部门 DeepMind 从头开始​​构建的全新多模态大型语言模型。Gemini 的众多功能之一是它将为 Google Bard 提供支持,而 Google Bard 此前一直难以摆脱聊天机器人先驱 OpenAI 的 ChatGPT 的阴影。

根据谷歌首席执行官 Sundar Pichai 和 DeepMind 联合创始人兼首席执行官 Demis Hassabis 12 月 6 日发表的一篇博客文章,LLM 有三个版本,分别是 Gemini Ultra、Pro 和 Nano,适用于各种应用。经过“微调”的 Gemini Pro 目前是 Bard 的基础,而 Nano 版本将出现在 Pixel Pro 智能手机等产品中。Gemini 版本也将在未来几个月内推出,用于谷歌搜索、广告和 Chrome,不过 Ultra 要到 2024 年才会向公众开放。

与许多 AI 竞争对手不同,Gemini 从发布之初就被训练成“多模式”机器人,这意味着它已经可以处理文本、音频和基于图像的提示。在附带的视频演示中,Gemini 被要求通过口头识别摆在它面前的东西(一张纸),然后实时正确识别用户画的鸭子草图。其他能力似乎还包括推断视频暂停后接下来会发生什么、根据视觉提示生成音乐以及评估儿童的家庭作业——通常带有一点俏皮、喜欢玩弄双关语的个性。然而,值得注意的是,视频描述中包含免责声明:“为了演示的目的,延迟已减少,Gemini 的输出已缩短以简洁。”

在后续的博客文章中,谷歌证实 Gemini 实际上只对静止图像和书面用户提示的组合做出响应,并且他们的演示视频经过编辑,以呈现更流畅的音频功能交互。

Gemini 随附的技术报告表明,LLM 最强大的版本 Ultra“在 32 个广泛用于 [LLM] 研究和开发的学术基准中,有 30 个超过了目前最先进的结果”。尽管如此,改进似乎有些温和——Gemini Ultra 正确回答多学科问题的比例为 90%,而 ChatGPT 为 86.4%。然而,无论统计结果如何,结果表明 ChatGPT 可能与 Gemini 存在真正的竞争。

[相关:ChatGPT 等人工智能聊天机器人背后的逻辑非常简单。]

不出所料,谷歌在周三的公告中警告称,其新推出的明星人工智能远非完美,仍然容易出现困扰新兴技术的行业范围内的“幻觉”——即法学硕士偶尔会随机编造错误或无意义的答案。谷歌还对 Gemini 进行了“谷歌人工智能模型中最全面的安全评估”,谷歌 DeepMind 产品副总裁 Eli Collins 在 12 月 6 日的发布会上表示。其中包括让 Gemini 接受“真实的毒性提示”,这是艾伦人工智能研究所开发的一项测试,涉及超过 100,000 个有问题的输入,旨在评估大型语言模型的潜在政治和人口偏见。

未来几个月,Gemini 将继续融入 Google 的产品套件,同时进行一系列封闭测试阶段。如果一切按计划进行,Gemini Ultra 驱动的 Bard Advanced 将于明年某个时候向公众推出——但正如目前已经确定的那样,正在进行的 AI 军备竞赛往往很难预测。

当被问及它是否由 Gemini 提供支持时,Bard 告诉PopSci ,它“不幸”无法访问“有关 Google 内部项目”的信息。

“如果你有兴趣了解更多关于‘双子座’的信息,我建议你通过谷歌官方渠道搜索信息,或者联系公司内部有权访问此类信息的人,”巴德在给PopSci的信中写道。“我很抱歉给你带来不便,希望这些信息对你有帮助。”

更新 12/08/23 11:53AM:谷歌于 12 月 6 日发布了一篇博文,澄清了其 Gemini 上手视频以及该程序的多模式功能。尽管演示可能看起来 Gemini 响应了移动图像和语音命令,但谷歌提供了静态图像和书面提示的组合。随后对视频进行了编辑,以减少延迟和简化流程。此后,本文的文本已进行编辑以反映这一点。

<<:  认识 NeRmo,有脊椎的老鼠机器人

>>:  2024 年,生成式人工智能或将面临最大的法律考验

推荐阅读

关于龙舌兰酒的五个热门问题,已解答

龙舌兰酒能激发人们强烈的意见,就像披头士乐队、山羊奶酪和 1988 年底特律活塞队一样。有些人无法忍...

您现在可以在 PC 上使用 Android 的“附近共享”功能

Android 用户为我们设备的多功能性感到自豪,但我们中的许多人一直暗暗羡慕苹果的 AirDrop...

《巴尼帕尔智慧》的吸引力与评价:深度评论

瓦尼帕尔·维特 - 从绘本中诞生的奇幻世界1995年7月25日上映的电影《Banipal Wit》改...

观看三星发布新款 Galaxy S21 智能手机和 Galaxy Buds Pro

https://www.youtube.com/watch?v=TD_BZN0bn_U三星已经在今...

反常天气导致臭氧层出现新空洞——这种情况可能再次发生

Jeremy Deaton 为Nexus Media撰稿。您可以关注他@deaton_jeremy ...

“Two Rings”:重新评价每个人歌曲中的动人音乐

《Two Rings》:NHK 教育电视台短篇动画讲述爱情与羁绊的故事2016年2月在NHK教育电视...

私人诺拉库罗:重新评价过去的经典动画

大兵ノルノウエ:战前日本动画的里程碑作品《大兵诺拉库罗》是一部1935年上映的日本动画电影,在战前日...

18 个值得在 iPhone 上尝试的酷炫 iOS 18 新功能

iOS 18 于 6 月发布后终于登陆 Apple 设备。只要您的手机运行 iOS 17,就有资格免...

100秒全面评测巨作剧场!

100秒杰作剧场 - 100秒杰作剧场概述《100秒名作剧场》是一部自2022年4月8日起在NHK...

在亚马逊 Prime Day 期间以今年最低价购买 Jackery 太阳能发电机

Jackery 在我们的太阳能发电机和便携式电站产品测试中经常名列前茅。目前,许多最受欢迎的型号在亚...

澳航新飞机将为 19 小时航班设立“健康区”

2019 年最后三个月,也就是疫情对全球航空旅行产生影响之前,澳航曾执行了三次超长“研究飞行”任务...

欧洲核子研究中心确认:大型强子对撞机被小型山毛榉貂击落

上周,你可能已经看到一些头条新闻在万维网上流传(讽刺),称一只黄鼠狼撞毁了大型强子对撞机 (LHC)...

Meta 希望通过研究人类大脑来改进其人工智能

如果人工智能旨在模仿大脑,用人工神经元网络代替真实细胞,那么如果将深度学习算法中的活动与人脑中的活动...

从距离地球近 100 万英里的卫星上看“火环”日食是什么样子

最近的“火环”日食在北美和南美部分地区看起来令人惊叹,现在我们对这一恒星事件有了新的认识。深空气候观...

Microsoft Office 售价 45 美元!(比亚马逊便宜)

我们和您一样喜欢亚马逊,但他们并不总是能以最优惠的价格提供您所需的产品。为什么他们要为 Window...