大模型:人类未来,还是海市蜃楼?

01 大模型的冰火两重天:大模型正在变笨吗?

最近,大量网友发现,他们的GPT-4处理能力正在退化,尤其是对问题的分析深度和代码质量,甚至还不如它的前身GPT-3或GPT-3.5。这让人不禁怀疑,OpenAI削减了ChatGPT的算力,或者更糟——大量用户的使用,让其出现了能力退化。

大模型:人类未来,还是海市蜃楼?

大模型:人类未来,还是海市蜃楼?

大模型:人类未来,还是海市蜃楼?

网友发文吐槽大模型变笨

群情汹涌之下,OpenAI的开发者推广大使不得不出来辟谣,GPT-4 API并没有降级,但对于web端却避而不谈。

同样的问题,也出在Anthropic的Claude和New bing上,显然,LLM的商业化还没有完全成熟。另一方面,最近因为AI芯片而估值过万亿的英伟达,也遭到了“罗斯柴尔德”家族的减持,其全球首席投资官投资官表示,减持的原因是AI的估值已经过高,“作为一项投资的话,我怎么都得不出每股400多美元的估值。”

大模型:人类未来,还是海市蜃楼?

NVIDIA创始人兼首席执行官黄仁勋

而在国内,大模型正在最火热的阶段,自今年3月以来,已有超过20家企业入局大模型赛道。从百度“文心一言”,到阿里的“通义千问”,从商汤“日日新”,到腾讯“混元”,再到京东“ChatJ”、华为“盘古”等等等等。

互联网巨头纷纷秀出“肌肉”,然而这场乱战背后,到底是一场新的技术革命,还是数字货币,元宇宙这样泡沫居多的风口?他到底会把大伙都赶去送外卖,还是通过强AI的又一次技术歧途?要解答这一系列的问题,我们首先要回顾一下大模型的发展史。

02 大模型简史

大模型的起源可以追溯到20世纪80年代,在之后的几十年里,其技术进步一直表现为随着计算机的性能发展,神经网络模型的深度和训练数据的规模缓慢增加。到2006年,随着深度信念网络模型的提出,第一个深度学习模型随之诞生。2017年,Google 团队研发出了Transformer 架构,使深度学习模型参数达到了上亿的规模,这才有了我们现在所见的大数据学习模型。

大模型:人类未来,还是海市蜃楼?

Transformer架构模型图

可以看出,大数据模型的提出距离现在并不遥远。一开始的大模型,主要也是技术意义,然而为何短时间内从人工智障,变成了风靡全球的人工智能?这中间又有什么惊人的技术进步?答案是,没有。当前业界公认,以ChatGPT为代表的大语言模型并不存在实质性的科学突破。图灵奖得主就曾经发推表示,“大型语言模型并没有物理直觉,它们还是基于文本训练的。”

大模型:人类未来,还是海市蜃楼?

大模型:人类未来,还是海市蜃楼?

ChatGPT之所以如此神奇,其核心原因并非是什么新技术,而是量变导致质变。对GPT-3为代表的语言模型研究发现,其性能表现并非随着模型规模增加而线性增长,当模型大到超过特定的临界值,就会涌现出较小模型不具备的能力。或者说得更直白点,当规模上亿的时候,大模型的实用意义几乎没有,15亿规模的GPT-2也只是牙牙学语的婴儿,只有当学习规模扩张到1750亿,令我们惊讶的ChatGPT才真正诞生。

大模型:人类未来,还是海市蜃楼?

ChatGPT前身GPT-3参数量为1750亿

从技术原理可以看出,大模型并没有突破我们平常理解的技术范畴,距离具有自我意识的超级AI更是还有遥远的距离。其之所以表现得像是有智慧一样,一方面是因为卓越性能,另一方面,则是当人们“看到计算机能表现出理解,就认为它真理解”的伊莉莎心理学效应在作怪,要知道,伊莉莎效应这个名词,诞生于上个世纪60年代的自动对话程序,现在的AI让人感到它似乎有智慧,又有什么难的?

所以大模型的能力,或者至少是大规模应用的能力,是有上限的,因为除了百亿千亿的可调参数,还有十层百层的深度神经网络层数,以及注意力头数,隐藏层大小,都会让其成本几何级增长,所以当收益无法覆盖成本的时候,大模型的能力就来到了上限。

03 大模型,何处去?

大模型并不是真的有智慧,一方面,指望它代替人类工作还并不现实,但另一方面,它也确实是是人类手里的威力倍增器,让原本需要大量人工的辅助工作逐渐消失。其已经让许多人失业,甚至还在让越来越多的人失业,

就以当今比较热门的AI害画师下岗为例,真正的顶级画师会因为AI没饭吃吗?

不会,但是他们作画,本来需要许多人为他们完成素材、画背景乃至上色等工作,而AI绘图一方面帮顶级画师省去这些麻烦,另一方面也让他们的工作效率飞跃性提升,客观上减少了人力需求,这就减少了固定工作量所需要的岗位,产生了暂时性能人力溢出。

大模型:人类未来,还是海市蜃楼?

AI生成的画作

实际上,这样的情况已经在更多领域出现了,阿里达摩院甚至发布了论文,表示AI工作效率和精准度比专业数据分析师更高,这当然不会让所有数据分析师下岗,但是少量分析师利用AI,完成远比之前更多工作量的未来,已经近在眼前。

所以,大模型是一股挡不住的潮流,因为它带来了效率的切实提升,因此一定会在降低成本的需求下,被推广到全社会的各个行业,全行业的各个角落。

而在这样的趋势下,大模型赛道开始快速分化为三个方向,一是对标GPT的通用大模型,聚焦基础层的公司;二是在开源大模型基础之上训练垂类大模型,聚焦垂直行业;不做研发直接调用接口做产品运营的春应用。

大模型:人类未来,还是海市蜃楼?

百度智能云副总裁朱勇曾表示,因为算力需求大、训练和推理成本高等原因,研发通用大模型的公司可能“只有那么几家”,但是上面会长出很多专业领域的大模型。在前不久举办的文心大模型技术交流会上,百度智能云也格外强调,百度以文心一言为核心,提供大模型服务,帮助企业开发自己的专属大模型。

可以说,从社会意义上,大模型堪称一场信息革命;然而从技术意义上,它距离强AI等科幻技术,还有大量技术瓶颈,然而我们要知道,大模型诞生也只有6年时间,技术研发是个非常容易产生奇点效应的事情。大模型仍然有着无限潜力。

本文地址:https://www.cknow.cn/archives/25187

以上内容源自互联网,由百科助手整理汇总,其目的在于收集传播生活技巧,行业技能,本网站不对其真实性、可靠性承担任何法律责任。特此声明!

如发现本站文章存在版权问题,烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com,我们将及时沟通与处理。