谷歌宣布推出 Gemini,这是 ChatGPT 的“多模式”解决方案

谷歌宣布推出 Gemini,这是 ChatGPT 的“多模式”解决方案

周三,谷歌宣布推出 Gemini,这是该公司 AI 部门 DeepMind 从头开始​​构建的全新多模态大型语言模型。Gemini 的众多功能之一是它将为 Google Bard 提供支持,而 Google Bard 此前一直难以摆脱聊天机器人先驱 OpenAI 的 ChatGPT 的阴影。

根据谷歌首席执行官 Sundar Pichai 和 DeepMind 联合创始人兼首席执行官 Demis Hassabis 12 月 6 日发表的一篇博客文章,LLM 有三个版本,分别是 Gemini Ultra、Pro 和 Nano,适用于各种应用。经过“微调”的 Gemini Pro 目前是 Bard 的基础,而 Nano 版本将出现在 Pixel Pro 智能手机等产品中。Gemini 版本也将在未来几个月内推出,用于谷歌搜索、广告和 Chrome,不过 Ultra 要到 2024 年才会向公众开放。

与许多 AI 竞争对手不同,Gemini 从发布之初就被训练成“多模式”机器人,这意味着它已经可以处理文本、音频和基于图像的提示。在附带的视频演示中,Gemini 被要求通过口头识别摆在它面前的东西(一张纸),然后实时正确识别用户画的鸭子草图。其他能力似乎还包括推断视频暂停后接下来会发生什么、根据视觉提示生成音乐以及评估儿童的家庭作业——通常带有一点俏皮、喜欢玩弄双关语的个性。然而,值得注意的是,视频描述中包含免责声明:“为了演示的目的,延迟已减少,Gemini 的输出已缩短以简洁。”

在后续的博客文章中,谷歌证实 Gemini 实际上只对静止图像和书面用户提示的组合做出响应,并且他们的演示视频经过编辑,以呈现更流畅的音频功能交互。

Gemini 随附的技术报告表明,LLM 最强大的版本 Ultra“在 32 个广泛用于 [LLM] 研究和开发的学术基准中,有 30 个超过了目前最先进的结果”。尽管如此,改进似乎有些温和——Gemini Ultra 正确回答多学科问题的比例为 90%,而 ChatGPT 为 86.4%。然而,无论统计结果如何,结果表明 ChatGPT 可能与 Gemini 存在真正的竞争。

[相关:ChatGPT 等人工智能聊天机器人背后的逻辑非常简单。]

不出所料,谷歌在周三的公告中警告称,其新推出的明星人工智能远非完美,仍然容易出现困扰新兴技术的行业范围内的“幻觉”——即法学硕士偶尔会随机编造错误或无意义的答案。谷歌还对 Gemini 进行了“谷歌人工智能模型中最全面的安全评估”,谷歌 DeepMind 产品副总裁 Eli Collins 在 12 月 6 日的发布会上表示。其中包括让 Gemini 接受“真实的毒性提示”,这是艾伦人工智能研究所开发的一项测试,涉及超过 100,000 个有问题的输入,旨在评估大型语言模型的潜在政治和人口偏见。

未来几个月,Gemini 将继续融入 Google 的产品套件,同时进行一系列封闭测试阶段。如果一切按计划进行,Gemini Ultra 驱动的 Bard Advanced 将于明年某个时候向公众推出——但正如目前已经确定的那样,正在进行的 AI 军备竞赛往往很难预测。

当被问及它是否由 Gemini 提供支持时,Bard 告诉PopSci ,它“不幸”无法访问“有关 Google 内部项目”的信息。

“如果你有兴趣了解更多关于‘双子座’的信息,我建议你通过谷歌官方渠道搜索信息,或者联系公司内部有权访问此类信息的人,”巴德在给PopSci的信中写道。“我很抱歉给你带来不便,希望这些信息对你有帮助。”

更新 12/08/23 11:53AM:谷歌于 12 月 6 日发布了一篇博文,澄清了其 Gemini 上手视频以及该程序的多模式功能。尽管演示可能看起来 Gemini 响应了移动图像和语音命令,但谷歌提供了静态图像和书面提示的组合。随后对视频进行了编辑,以减少延迟和简化流程。此后,本文的文本已进行编辑以反映这一点。

<<:  认识 NeRmo,有脊椎的老鼠机器人

>>:  2024 年,生成式人工智能或将面临最大的法律考验

推荐阅读

2024 款宾利欧陆 GT 的热成像摄像头非常有趣

简单概括一下这款售价 35 万美元的宾利欧陆 GT 轿跑车,那就是它颠覆了人们的认知。撇开价格冲击不...

中世纪厕所有助于揭开英国最后一位盎格鲁撒克逊国王失落的故居

英国的一支考古队认为,他们找到了英国最后一位盎格鲁-撒克逊国王哈罗德·戈德温森的失落居所。这座住宅出...

《杜鹃的未婚夫》评论:一个感人的故事,有出人意料的转折和迷人的人物

《布谷鸟的未婚妻》:一部描绘复杂人际关系和青春光辉的青春爱情喜剧《布谷鸟的未婚妻》是一部电视动画,改...

一款新应用可自动将合影发送给你的朋友

“当然,我会把那张照片发给你。”我们在聚会、度假或正式场合经常说这句话。但有些人(比如我)很健忘,而...

看这个家伙通过故障重制超级马里奥

超级马里奥时空风琴 (illucia 和 soundplane) 来自 paperkettle 的 ...

鸣禽能教会我们如何变得聪明

什么才是聪明?如果聪明的定义是拥有最大的大脑,那么抹香鲸(其头部重达 20 磅)就是地球上最聪明的生...

为什么大型动物不能忍受一点雨

剑齿虎 美国自然历史博物馆冰川和永久冻土的融化对于上一个冰河时代的大型动物来说并不友好。持续的潮湿使...

尤里!!! on ICE 4DX 是一次惊心动魄的体验——花样滑冰的魅力从屏幕中跃然而出!

“Yuri!!! on ICE 4DX” - 在4DX中体验花样滑冰的美丽与刺激《Yuri!!! ...

我们不会放弃!阪神大地震6年3班 彻底解析西宫市立桧野口小学的感人故事

《绝不放弃!阪神大地震西宫市立日野口小学6年3班》~将地震记忆传递到未来的动画1995年1月17日,...

OVA《高校舰队》的魅力与评价:海洋冒险的新魅力

OVA《高校舰队》的魅力与详细评论OVA《高校舰队》由Aniplex于2017年5月24日发售,是一...

这就是你的大脑如何分辨时间

你的大脑:时间机器 Sinelab你的大脑一直在计算:说话的节奏、下次吃零食前的时间、短信之间可怕的...

最后一位战斗机飞行员

在距离菲尼克斯市中心约 20 英里的尘土飞扬的停机坪上,约瑟夫·斯滕格上尉站在 109 华氏度的高温...

我们正在进入第六次大规模灭绝,这是我们的错

可悲的是,如今,我们经常听到人类不负责任的行为以无数种方式毁灭地球。这份名单很长,也很残酷,尽管许多...

严厉打击烟尘污染可以挽救数千人的生命——但环保署不会这么做

本周,特朗普政府继续进行最后的冲刺,决定维持一项被弱化或过时的环境规则,但许多科学家认为该标准无法保...