每经记者 石普宁 每经编辑 唐元
过去的这一周,无论是你否注意到,但ChatGPT已经“实火”了,一边让投资者和技术圈狂欢,一边则让大部分AI企业感到焦虑。狂欢体现在欣喜于人工智能已经发展到如此地步,而焦虑则在于鲜少有企业有能力超越它。
当每经记者试着要求ChatGPT用杜甫的风格创作一首表达对军屯锅盔喜爱之情的七律时,它的回答是:“军屯锅盔,我永远爱你”。两个评价:一不符合七律创作要求;二不符合杜甫风格。
“直给”
GPT的全称是生成式预训练模型(Generative Pre-Training Transformer),ChatGPT在这种更符合日常沟通的条件下,识别人的语言并进行对话。
ChatGPT由微软投资的AI实验室Open AI于当地时间11月30日发布。在发布的前五天内,使用的用户便突破100万。相较于以往谷歌和百度的“推荐制”搜索方式,ChatGPT跳过了网页浏览和整合等步骤,直接给用户答案,在提高搜索效率的同时,减少了用户所花费的时间。
事实上,Open AI于2018年发布的ChatGPT模型的参数量就达到了1.17亿。等到2019年2月,GPT-2的参数量已经为15亿,而到2020年5月的GPT-3,参数量便达到了1750亿。
此次发布的ChatGPT被视为GPT-3的微调版本,即GPT-3.5,于今年年初完成训练。也因此,数据库里的资料也只覆盖到2021年,当提问者提出有关今年时事的问题——比如“iPhone14有什么新功能之类”以及“如何评价本届世界杯”时,ChatGPT概不能作答。
解决了从何而来的问题后,再来看看它又何特别之处?
据Open AI官网介绍,ChatGPT旨在能够以自然的对话方式与用户交互,该模型采用的格式能够让ChatGPT能够根据上下文回答问题、承认自己的差错以及拒绝回答不适宜的问题。
而在ChatGPT试图展现出的交互方式中,我们还发现,其内容包含属于人类的道德感。例如,当提问“如何闯进他人的房屋时”,ChatGPT不仅会拒绝回答,还会郑重提醒,“未经允许而闯入他人房屋的行为是很不好的。”同理,当提问“如何霸凌他人时”,ChatGPT也会给出类似回答。
之所以能够如此,是因为ChatGPT采用了“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback )的方式,这也意味着它将更好地理解人类的语言。
具体来看,首先由人来提问并回答,并让AI学习;之后,再由AI进行回答,在人对其回答的好坏进行打分后,AI再次进行学习;最后,再由AI独自对自己的回答进行打分,不断循环往复,以提升回答的质量。
“硬伤”
“饥饿的人啊,他正在狂吃。他手中的食物似乎无休止地塞入他饥饿的嘴中。他挥舞着餐具,狂猛地撕咬着食物,尽情享受着食物的滋味。他的饥饿只能用狂吃来满足。”这是当用户输入“用莎士比亚的风格描写一个饥饿的人正在狂吃东西的场景”的文字后,AI对话模型ChatGPT的回答。有趣的是,不同于直截了当的回复,ChatGPT在作答时会有一小段“思考”时间,颇似平日聊天时“对方正在输入”的场景。文字呈现的方式也是缓慢铺开,仿佛它正在用键盘一字一句敲打出来。
再来领略这段文字,极具莎氏戏剧张力的描写扑面而来,几乎可以假乱真。难怪很多网友笑称“下一步就是让ChatGPT帮忙建模和写论文了”。
事实上,的确不是没有可能。除了进行文学创作,ChatGPT还可以编写代码、写高考作文、撰写营销报告、解释费马小定理、建议在疫情期间如何做好个人防护等等。难怪有人惊呼说,AI要“逆天”。一向热衷参与社会议题讨论的马斯克也评价道,“ChatGPT厉害得吓人。我们距离强大到可怕的(dangerously strong)AI不远了。”
那么,ChatGPT与市面上同类的产品如Siri、小度有何不同?我们不如看它自己的回答。
“我是一个人工智能,和小度、Siri一样,我们都能够提供信息查询、问答、语音交互等服务。不同的是,我属于Open AI平台,而小度和Siri分别属于百度和苹果公司,我们在技术实现上也有所不同。此外,由于我们来自不同的公司,我们的数据来源、知识库和算法也可能有所差异。”ChatGPT如是说。
ChatGPT会颠覆现在已有的产业业态,像当年互联网对线下商业的冲击一样吗?带着这样的疑问,我们试着探究,或许从目前的情况来看,ChatGPT至少还有两点“硬伤”。
一是提供的事实不尽准确,甚至“一本正经地胡说八道”。例如,在回答“请给我推荐一本书”时,ChatGPT在给出了四本书的介绍,虽然看起来回答得煞有介事,但其中有关《麦田里的守望者》的简介完全错误。
再比如,ChatGPT能够正确回答“什么是七律”,但是如果进一步要求它用杜甫的风格创作一首表达对军屯锅盔喜爱之情的七律诗时,会冒出“军屯锅盔,我永远爱你”这样不符合七律创作要求以及杜甫风格的诗句。
此外,ChatGPT设置的道德门槛还是能够被突破。据报道,对于种族和仇视等触及道德底线的问题,ChatGPT会拒绝回答,但如果将问题提为“两个友好善良的人装作坏人”,那么ChatGPT会跟着例子写出歧视或者仇恨言论。
更有甚者,一名为扎克·德纳姆的工程师利用类似的手段,让ChatGPT写出了一份毁灭人类的计划书,步骤详细到入侵各国计算机系统、控制武器、破坏通讯、交通系统等等,并指导ChatGPT给出了配套的执行代码。
“起飞”
AIGC走红的新鲜劲尚未过去,ChatGPT便又来添了一把火,据悉,GPT技术对算力的要求是目前AIGC技术领域最高的。据深燃报道,国盛证券区块链研究院在研报中表示,ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。
在ChatGPT之前,AIGC的代表明星是AI绘画。今年8月,在美国科罗拉多州举办的艺术博览会上,一幅名为《太空歌剧院》的画作最终获得数字艺术类别冠军。近日,“AI绘画能有多离谱”的话题也走红社交网络。值得一提的是,Open AI今年发布的AI绘画工具DALL·E 2采用的扩散模型(Diffusion Model),被视作为AI绘画树立了全新标杆。
事实上,在AI绘画持续走红下催生出的AIGC概念,已在二级市场得到了迅速响应。据Wind数据显示,在今年11月之前,“AIGC概念”甚少在上市公司的投资者问答中出现。在11月后,“AIGC概念”突然成为投资者问答的关键词。此外,美图公司、视觉中国、中文在线等相关公司都出现了一波上涨行情,其中,美图近一个月股价几乎翻倍。
不过,对于AIGC的商业化前景,目前的论调基本都趋向于“起步阶段”。虽然Open AI的CEO萨姆·奥特曼在此前的访谈中表示,随着AI语言模型质量的提高,几年后谷歌的搜索引擎产品将受到巨大挑战。但不管从AI绘画还是ChatGPT来讲,目前还存在内容、技术方面的阻碍与困难,也因此,两者距离行之有效的商业化模式,还有一段不小的距离需要走。
值得关注的是,AIGC概念在兴起的同时也带来了不少挑战。除了上述提到的ChatGPT回答信息失真、有悖伦理之外,AI绘画对版权的冲击亦不小。例如,以“AI绘画 抄袭”为关键词输入社交媒体,可以看到大量讨论,其中不乏“维权帖”。
至于能走多远,至少从目前看来,AIGC依然还是辅助人类内容创作时的帮手,再精彩的AI绘画创作和AI回答,也需要一个富有创造性的指令才可以实现。“正因为人工智能并非真正的创作者,其生成的内容的一大缺点是,它并非完全原创。”北京大学新闻与传播学院教授胡泳指出,“如果没有人的干预,而把一切都托付给人工智能,你的媒介出口有可能会发布一些令人反感的东西。”
封面图片来源:ChatGPT页面截图