西方感恩节和圣诞节期间通常并不是推出新技术的合理时间,但对Alphabet的旗舰子公司谷歌而言,今年的这段时间也是绝望的时刻。一年前,这家行动迟缓的搜索巨头被推出ChatGPT的OpenAI甩在身后,它急于描绘出自己飞速前进的画面。在媒体报道称谷歌将推迟发布Gemini之后,该公司周三突然发布Gemini。Gemini是一款全新的人工智能模型,可以识别魔术中的技巧,并在会计认证考试中取得好成绩。谷歌发布的演示视频震惊了社交媒体,但从技术角度来看,谷歌仍被OpenAI甩在身后,正在努力地追赶。
谷歌对Gemini模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解,到数学推理等任务。从谷歌发布的数据上看,Gemini
Ultra是首个在大规模多任务语言理解数据集(MMLU)任务表现上优于人类专家的大模型,得分率高达90.0%。作为对比,人类专家的成绩为89.8%,GPT4的成绩为86.4%。MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目,用于测试大模型的知识储备和解决问题能力。
但在大多数基准测试中,Gemini
Ultra仅领先OpenAI的GPT-4模型几个百分点。换句话说,谷歌最好的AI模型只是在OpenAI至少一年前完成的工作上做出了微小的改进。如果像谷歌所说的那样,Gemini
Ultra在明年1月初发布,它可能不会在很长时间内保持顶级模型的地位。在谷歌拼命赶上OpenAI的这段时间里,后者已经花了将近一年的时间来开发它的下一代人工智能模型GPT-5。
承认演示视频为剪辑版本
在谷歌发布的时长为6分钟的演示视频中,一个男子做出后仰并躲避的慢动作,Gemini马上猜出这是表演《黑客帝国》中的场景;当人类拿起画笔在一张纸上勾勒出一只鸭子,并为它涂上了蓝色,Gemini说这可不是鸭子常见的颜色;当人类用手指比划剪刀石头布的动作时,Gemini马上猜出是在玩剪刀石头布;当三个空杯并排放在桌子上,一张蓝色纸团被塞进其中一个杯子里,在人类一番眼花缭乱的操作后,Gemini准确地猜出:“纸团在最左边的杯子里!”这段视频展示了谷歌DeepMind人工智能实验室在过去几年中训练的推理能力,也是其他人工智能模型所没有的。
在社交媒体X上发布的这段视频的跟帖中,技术专家称Gemini的表现“令人瞠目结舌。”不过沃顿商学院管理学教授伊桑·莫里克(Ethan
Mollick)经过比对实验证明了,Gemini展示出的许多能力并不是独一无二的,GPT-V早已具备了这些能力。
彭博专栏作家帕米·奥尔森(Parmy
Olson)对此撰文指出,Gemini在视频中似乎非常能干了。但谷歌自己也承认,视频是剪辑过的。该公司在YouTube的描述中表示:“为了演示的目的,为了简洁起见,延迟被减少了,Gemini的输出也被缩短了。”这引发出关于谷歌实际上给Gemini提前埋了多少提示的质疑。
这就是奥尔森发现的端倪。根据她的彭博文章,谷歌承认视频演示不是实时进行的,而是使用原始镜头中的静止图像帧,然后写出文本提示,让Gemini做出回应。奥尔森写道:“这与谷歌似乎暗示的完全不同:一个人可以在Gemini观察并实时回应周围世界的同时,与它进行流畅的语音对话。”奥尔森认为,谷歌的视频就是在“炫耀”,目的是误导人们,让他们不知道Gemini仍然落后于OpenAI的GPT。
谷歌不同意奥尔森的观点。当被问及演示的有效性时,谷歌发言人指出,DeepMind负责研究和深度学习的副总裁奥瑞奥·维纳尔斯(Oriol
Vinyals)的一篇帖子,解释了该团队如何制作视频。维纳尔斯:“视频中所有的用户提示和输出都是真实的,为了简洁起见被缩短了。”该视频展示了使用Gemini构建的多模态用户体验。我们制作它是为了激励开发者。”
-->
`,
"script":[]
}
, "gg_rightside": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_duturandom": {
"html":`
`,
"script":[]
}
, "gg_square": {
"html":`
`,
"script":[]
}
, "gg_topbanner": {
"html":`
`,
"script":[]
}
, "gg_middlesquare": {
"html":`
`,
"script":[]
}
, "gg_dutu": {
"html":`
`,
"script":[]
}
, "gg_botline": {
"html":``,
"script":[]
}
, "gg_dututop": {
"html":`
`,
"script":[]
}
, "gg_shipintop": {
"html":`
`,
"script":[]
}
, "gg_inContent": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_shipinrandom": {
"html":``,
"script":[]
}
, "gg_sideSticky": {
"html":`
`,
"script":[]
}
, "gg_bottombanner": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_marquee": {
"html":`
`,
"script":[]
}
}
const adEnv={
"gg_header": {
"html":``,
"script":[{"exec":`(function(){/*
Copyright The Closure Library Authors.
SPDX-License-Identifier: Apache-2.0
*/
'use strict';var g=function(a){var b=0;return function(){return b
=b||null!=a.a&&0!=a.a.offsetHeight&&0!=a.a.offsetWidth||(fa(a),D(a),l.setTimeout(function(){return E(a,b-1)},50))},fa=function(a){var b=a.c;var c="undefined"!=typeof Symbol&&Symbol.iterator&&b[Symbol.iterator];b=c?c.call(b):{next:g(b)};for(c=b.next();!c.done;c=b.next())(c=c.value)&&c.parentNode&&c.parentNode.removeChild(c);a.c=[];(b=a.a)&&b.parentNode&&b.parentNode.removeChild(b);a.a=null};var ia=function(a,b,c,d,e){var f=ha(c),k=function(n){n.appendChild(f);l.setTimeout(function(){f?(0!==f.offsetHeight&&0!==f.offsetWidth?b():a(),f.parentNode&&f.parentNode.removeChild(f)):a()},d)},h=function(n){document.body?k(document.body):0e;e++){var f=c.concat(d[e].split(""));K[e]=f;for(var k=0;k>2;n=(n&
3)<<4|t>>4;t=(t&15)<<2|h>>6;h&=63;f||(h=64,e||(t=64));c.push(b[k],b[n],b[t]||"",b[h]||"")}return c.join("")};try{return JSON.stringify(this.a&&this.a,S)}finally{Uint8Array.prototype.toJSON=a}}:function(){return JSON.stringify(this.a&&this.a,S)};var S=function(a,b){return"number"!==typeof b||!isNaN(b)&&Infinity!==b&&-Infinity!==b?b:String(b)};M.prototype.toString=function(){return this.a.toString()};var T=function(a){O(this,a)};u(T,M);var U=function(a){O(this,a)};u(U,M);var ja=function(a,b){this.c=new B(a);var c=R(b,T,5);c=new y(w,Q(c,4)||"");this.b=new ea(a,c,Q(b,4));this.a=b},ka=function(a,b,c,d){b=new T(b?JSON.parse(b):null);b=new y(w,Q(b,4)||"");C(a.c,b,3,!1,c,function(){ia(function(){F(a.b);d(!1)},function(){d(!0)},Q(a.a,2),Q(a.a,3),Q(a.a,1))})};var la=function(a,b){V(a,"internal_api_load_with_sb",function(c,d,e){ka(b,c,d,e)});V(a,"internal_api_sb",function(){F(b.b)})},V=function(a,b,c){a=l.btoa(a+b);v(a,c)},W=function(a,b,c){for(var d=[],e=2;ec?0:c}else c=-1;0!=c&&(W(a.b,"internal_api_sb"),Z(a,Q(a.a,6)))},function(c){Z(a,c?Q(a.a,4):Q(a.a,5))})},Z=function(a,b){a.c||(a.c=!0,a=new l.XMLHttpRequest,a.open("GET",b,!0),a.send())};(function(a,b){l[a]=function(c){for(var d=[],e=0;e2){dom.hide();}}$("#showallcomment").show();$("#showlesscomment").hide();};',
],
"src":[
{"src":"//count.wenxuecity.com/service/count/script/do.php?type=news&id=125311439&n=0&out=jsval"},
{"src": "/news/js/view.js"},
{"src":"/members/js/md5.js"}
]
}
}