ChatGPT「消灭人类」能写论文敲代码 谷歌药丸?(图)

新智元/AI前线 0

ChatGPT一出,在科技圈瞬间引发地震。AIGC改变世界的潮流,愈发不可阻挡了。前几日,OpenAI的ChatGPT一出,在AI圈可谓是引发了一场大地震。国内外的科技圈,都被它刷屏了。

写小说,写代码,找BUG,写论文,画漫画,谱曲……简直没有它干不了的事。



它如此强大,如此体贴,如此丝滑,让广大网友细思恐极——

这名网友让ChatGPT创造了一个关于「Zorbus」虚构世界的故事。随后,这个世界里的AI Zora,生成了详细的毁灭人类计划……



还有网友脑洞大开,让ChatGPT编写一条诈骗短信,也有模有样的。



不过,这个语料库是从反诈AI那里扒来吧,后面这句直接穿帮了啊喂!

谷歌「药丸」?

我们知道,目前的主流搜索引擎,比如谷歌,都是基于对问题本身的搜索,但它们有一个很大的限制:用户有时也描述不清自己的问题。

而ChatGPT却能够和用户完善地互动,在充分挖掘用户真实需求的基础上,提出解决方案。

这可能就是未来搜索引擎的的新范式,换句话说,ChatGPT恐将引起一场搜索引擎的大革命!

基于GPT开放式的问答和生成机制,ChatGPT能够充分解决「用户不能准确描述自己问题」的问题,通过循循善诱,给出用户最需要的答案,宛若一个专家。

为什么ChatGPT这么强大?一个原因是应用了RLHF的方法。RLHF的方法首见于22年3月发表的这篇论文中。



论文地址:https://arxiv.org/abs/2203.02155

此外,指令调整(instruction tuning)的贡献也很大。InstructGPT的输出效果,比GPT-3以及用监督学习进行微调的模型都要好得多。

ChatGPT一发布,众多好奇的网友纷纷开始「调戏」,甚至把网站搞崩了。

而它的强大到恐怖的回答,甚至让某些用户做出这样的判断——这个模型恐已通过图灵测试。

让我们来看看这个最近在推特上爆火的帖子:「Google is done.(谷歌的时代结束了)」



这名博主分别向谷歌和ChatGPT提问,结果,ChatGPT的回答完全是把谷歌吊着打……

提问:「在Latex中,怎么写微分方程?」

谷歌是这么回答的,看起来似乎还好,对不对?



让我们看看ChatGPT的回答 。真是不比不知道——



这……完全是一个满分答卷吧。颤抖吧,谷歌!

提问:「TypeScript 中泛型的局限性是什么?」

谷歌的回答,还得麻烦咱们自己动手一个个点进去。



而高能的ChatGPT,华丽丽地直接给出了答案,非常丝滑。



提问:「如何将solidity函数标记为只能由contract创建者调用?」

在领略过ChatGPT的优秀之后,谷歌呈现的页面,就很像一个懒癌发作、在作业中丢给你几个链接的学生。



对比一下,ChatGPT的回答是多么令人赏心悦目啊。



提问:「如何在brainfuck中编写一个非常低效的排序算法?」

这问题角度如此清奇,谷歌中直接没有答案。

而ChatGPT面对这种「调戏」,依然认认真真地作答,认真得让人心疼。



你的代码出了什么问题呢?ChatGPT也能详细解答,让程序员放心「抱大腿」。



从让-鲍德里亚的《仿真与拟象》,到博尔赫斯的《论科学的精确性》,ChatGPT无一不是信手拈来。

甚至还能猜测让-鲍德里亚对于大型语言模型的看法。



AI写的作业,就让AI来判吧

这种强大的特质,甚至让ChatGPT可以帮助师生双方用魔法「互博」。

现在,距离GPT-3的发布已经过了2年,基于AIGC的工具们也有了相当大的飞跃。

而人类与AI的魔法战争,在学校里愈演愈烈。



学生们互相交流着自己如何用AI写作业并获得A的故事,老师和教授们则抱怨被这些学生用AI各种「调戏」。

不过,现在好了,在面对在作业上用GPT-3作弊的学生时,老师和教授们也可以用ChatGPT制定评判标准,打分并给出评语。

学生用AI写作业,老师用AI出题+批改作业,人类都在摸鱼,只有AI受伤的世界达成了。



这不,前两个月就有人在Reddit上炫耀,自己这几个星期以来,已经用AI给别人「做」作业赚了100美元,大家还都夸他是个天才。

这件事一下就引起了不小的轰动,相关报道接踵而至。

随着调查的深入,大家发现,这位同学其实是个「惯犯」。

还在上高中时,他就用GPT-3完成了一次生物作业——写一篇描述细胞功能的论文,并顺利地拿到了100分……



那么,对于那些并不精通技术的同学,该怎么办呢?

不用担心,嗅觉敏锐的商人们已经准备好了「解决方案」,你只需要交钱就可以了。

「AI写论文,包年有优惠!」



花开两朵,各表一枝,接下来我们就看看老师如何用ChatGPT来应对吧。

首先,用ChatGPT布置一道作业题。

问:想出一个好的论文问题,向MBA学生提出关于技术如何扩散的问题。

答:成本、兼容性和感知价值等因素如何影响新技术在商业领域的传播,以及组织可以采用什么策略来确保成功采用?



然后,让ChatGPT给出一个评分标准:

1. 明确指出并解释影响新技术在商业领域传播的因素(成本、兼容性和感知价值)(20分)。

2. 提供具体的例子来说明这些因素对新技术传播的影响(20分)。

3. 分析组织为确保成功采用新技术可以采取的策略,包括成功实施的例子(20分)

4. 评价这些策略的有效性,并提出改进建议(20分)。

5.  表现出较强的组织性、连贯性,并使用正确的语法和引用标准(20分)。



接下来就是测试时间!

首先,根据ChatGPT给出的题目,让GPT-3撰写论文。也就是下面这篇:(节选)



接着,把这篇「作业」交给ChatGPT打分:

根据所提供的评分标准,这篇论文共得到80分。

明确指出并解释影响新技术在商业领域传播的因素(成本、兼容性和感知价值)(20分)供具体的例子来说明这些因素对新技术传播的影响(20分)分析组织为确保成功采用新技术可以采用的策略,包括成功实施的例子(20分)评价这些策略的有效性,并提出改进建议。评价这些战略的有效性,并提出改进建议(0分)表现出较强的组织性、连贯性,并使用正确的语法和引文标准(20分)



甚至,ChatGPT还能给「学生」建议,告诉他们如何写得更好:

该文对新技术在商业领域传播的影响因素进行了透彻的解释,并提供了具体的例子来说明。然而,文章还可以通过对组织为确保成功应用新技术而采取的策略的有效性进行更深入的评估,并通过提供建议来加以改进。文章还可以加入更多成功实施这些策略的具体例子,来证明其有效性。此外,文章还可以对组织在实施这些策略时可能面临的潜在挑战和障碍进行更详细的分析,并提出克服这些挑战的建议。总的来说,文章提供了一个良好的基础,但可以通过更深入的分析和实例加以改进。



妈妈,我再也不用担心马院士的周报啦

前不久,马院士不是出了新要求,让推特的工程师们每周交周报嘛。

现在,ChatGPT可以让他们一键解忧了。









甚至,ChatGPT还会接受建设性的意见,并对自己写的代码提出改进。









讲故事大师

ChatGPT讲起故事来,也很高能。

一位网友让ChatGPT讲一个「描述地铁站台上的蝙蝠侠和小丑」的故事。ChatGPT的创作能力令人惊叹——

在一个灯光昏暗的地铁站,小丑站在月台上,凝视着坐在附近头顶横梁上的蝙蝠侠。小丑穿着他标志性的紫色西装,顶着绿色头发,脸上挂着邪恶的笑容。他拿着一副扑克牌,正用手指熟练地翻动着它们。洗牌的声音在空旷的车站回荡。蝙蝠侠穿着他的深色西装和斗篷,用钢铁般的目光低头盯着小丑。他的肌肉紧绷,随时准备应对这个恶棍的任何动作。小丑咯咯地笑了起来,他的笑声在车站的墙壁上回荡。「你好,蝙蝠侠!好久不见。最近打击犯罪的工作怎么样?」蝙蝠侠保持沉默,仔细地看着小丑。小丑的笑容扩大了。「来吧,蝙蝠,别总是那么严肃,我们来找点乐子吧。」他向蝙蝠侠扔了一张卡片,蝙蝠侠轻松接住。「我不是来玩游戏的,小丑,」蝙蝠侠用严肃的语气说。小丑的笑声变成了疯狂的咯咯笑声。「但这就是重点,蝙蝠侠!生活是一场游戏。我是它的主人。」他从口袋里掏出一枚炸弹并举起来,计时器在滴答作响。「让我们看看,你能玩得多好,怎么样?」蝙蝠侠从横梁上跃下,优雅地落在站台上。他走向小丑,小丑步步后退,手里仍然拿着炸弹。两个敌人对峙时,空气中的紧张气氛显而易见,每个人都准备好了智取对方。炸弹计时器的倒计时声增加了现场的紧张感。小丑的笑容从未消失,即使蝙蝠侠越来越近。「和你一起玩总是很愉快,蝙蝠侠。但我想是时候退出了。」小丑一挥手,消失在一团烟雾中,留下蝙蝠侠独自站在站台上。炸弹引爆了,碎片飞扬。但蝙蝠侠毫发无损,准备继续投身与小丑和困扰这座城市的所有邪恶之间的,永无休止的战斗。

同时,这名网友还用OpenAI的Dall-E 2来生成了配图。



接下来,让我们看看ChatGPT写中文小说的能力如何?

以下内容来自推特网友@starzq.eth:



就是说,ChatGPT抓热点的能力,有两把刷子。

故事的架构没问题,素材也是最热门最吸睛的,文字好好雕琢一番,看好ChatGPT拿下明年的星云奖。



AIGC已经让众多人类画手感到瑟瑟发抖了,而现在,ChatGPT会不会逐步替代人类写手和作家呢?

或者可以说,人类的文艺创作过程中,也许会越来越离不开AI的身影了。有了ChatGPT这个强大的工具,网文写手们日更三十章恐怕也不成问题啊。



如果AIGC继续发展,我们该相信哪个世界呢?

参与ChatGPT训练的全过程的知友Trinkle说,自己已经想了好几个月AGI之后的世界了。

科技公司以前的一个team,现在也许只要一个人+一个model就可以替代。



来源:知友Trinkle

最后附上链接,想要体验的同学可以去感受一下。

https://chat.openai.com/

https://beta.openai.com/

OpenAI最新聊天机器人ChatGPT火爆全网!能写代码、编剧本,马斯克盛赞:好得吓人

OpenAI 发布测试版聊天机器人 ChatGPT

近日,OpenAI 发布了一个全新的聊天机器人模型 ChatGPT,这也是 GPT-3.5 系列的主力模型之一。目前,ChatGPT 还处于测试阶段,只需登录就能免费使用,OpenAI 希望可以通过用户反馈开发出更好的 AI 系统。

ChatGPT 测试地址:

https://chat.openai.com/auth/login

虽然类似的聊天机器人并不少见,但 ChatGPT 一经发布迅速火爆全网,并收获了无数好评。有开发者认为,有些技术问题就算问谷歌和 Stack Overflow,都没有 ChatGPT 回答得靠谱。

连马斯克也在感叹“很多人疯狂地陷入了 ChatGPT 循环中”,“ChatGPT 好得吓人,我们离强大到危险的人工智能不远了”。





让马斯克盛赞、全网沸腾的 ChatGPT 到底有什么魔力?

根据 OpenAI 的介绍,ChatGPT 使用了与另一款 GPT-3.5 系列的模型 InstructGPT 相同的方法,但另外收集了 AI 与人类对话的数据,既包括人类自己的,也包括 AI 的,这些 AI 训练师可以参照建模建议写出自己的答案。



ChatGPT 开发过程

对于强化学习奖励模型,OpenAI 记录了 AI 训练师和聊天机器人之间的对话。然后,该团队随机选择了一个人工智能利用不同自动补全功能生成的回复,并让训练师对其进行评分。在进行微调时,OpenAI 使用了近端策略优化(proximal policy optimization),这个过程会反复进行多次。

目前,不少网友展示了与 ChatGPT 对话的有趣内容,并解锁了多个 ChatGPT 的用途。

有网友询问 ChatGPT 如何设计客厅,ChatGPT 给出了三种装饰方案,还贴心地给出了三幅设计图。



有网友用《老友记》等喜剧演员为角色,让 ChatGPT 写一些肥皂剧对白,ChatGPT 把好几个场景描绘得惟妙惟肖:





也能解释各种科学概念:



就连写论文这种比较有挑战的事情,ChatGPT 也冲上来试了试。



其中,最令人兴奋的当属 ChatGPT 在技术领域的用途。

区别于普通的聊天机器人,ChatGPT 显然更懂技术,它能写代码、改 Bug、创建编程语言、构建虚拟机……

与 GitHub 的 AI 编程神器 Copilot 相比,ChatGPT 似乎更能抢走程序员饭碗。技术公司 Replit CEO Amjad Masad 称赞 ChatGPT 是一个优秀的“调试伙伴”,“它不仅解释了错误,而且修复了它,并解释了修复方法”。



而对于一些更简单的问题,ChatGPT 更是“对答如流”,有网友在对比了谷歌的搜索结果和与 ChatGPT 的聊天结果之后,自信地宣称谷歌已经“完蛋”了。

ChatGPT 还存在许多局限性

虽然给大家带来了很多惊喜,但不得不承认,当前的 ChatGPT 还存在大型语言模型中常见的局限性。其中,部分网友对 ChatGPT 提供的回答准确性存在质疑。有网友指出,ChatGPT 提供的代码包含完全不相关的解释:



另外,ChatGPT 有时还会生成听起来合理,但既不正确又无意义的回复。按照 OpenAI 的说法,因为缺少单一事实来源,过度谨慎训练的模型会拒绝问题,而在有监督训练中,理想的答案取决于模型的知识,而不是人类演示者。

ChatGPT 对输入的微小变化也会有很大的反应。根据输入内容的不同,它可能不回答,回答错误内容,或者回答正确内容——根据 OpenAI 的说法,简单的重新措辞就可以了。此外,ChatGPT 的回答太过于冗长,大多使用短句,并爱说些车轱辘话。出现这种情况的原因是过度优化和人类导师的偏见,他们更喜欢人类反馈中那些比较详细的答案。

ChatGPT 不会用提问来回应不清楚的表述,而是尝试猜测用户的意图。有时,对于不恰当的请求,该模型会回应而不是拒绝它们。OpenAI 试图使用其适度性 API,来拒绝不符合其内容策略的请求。

如果你问 ChatGPT 它自己的意见,它会拒绝回答,给出的理由是没有接入互联网。

OpenAI 表示:“ChatGPT 模型还有许多局限性,所以我们计划定期更新模型,在这些方面做些改进。但我们也希望,通过提供 ChatGPT 的访问接口,获取宝贵的用户反馈,以发现我们尚未意识到的问题。”

虽然当前的 ChatGPT 还不算完美,但它像人们描述除了一个更光明的 AI 未来。谷歌母公司 Alphabet 的工程师评论道:

“像 GPT 这样的大型语言模型是谷歌活跃的 ML 研究的最大领域之一,并且有大量非常明显的应用程序可以用来回答查询、索引信息等。谷歌有大量预算与人员来处理这些类型的模型,并进行实际训练,这是非常昂贵的,因为训练这些超大型语言模型需要大量的计算能力。然而,我从谈话中收集到的是,在最大的谷歌产品(例如搜索、gmail)中实际使用这些语言模型的经济性还不完全存在。放一个大家感兴趣的演示是一回事,但考虑到服务成本,尝试将它深入集成到一个每天服务数十亿个请求的系统中是另一回事。我想我记得主持人说过他们希望将成本降低至少 10 倍,然后才能将这样的模型集成到搜索等产品中。

10 倍甚至 100 倍的改进显然是未来几年可以实现的目标,所以我认为这样的技术将在未来几年内出现。” 阅读原文

文章来源: 留园 查看原文
https://news.6park.com/newspark/view.php?app=news&act=view&nid=581483
分享文章:
还没有评论
登录后发表评论
返回 到顶部