大模型：人类未来，还是海市蜃楼？

2023年6月11日 06:53 • 科技号

01 大模型的冰火两重天：大模型正在变笨吗？

最近，大量网友发现，他们的GPT-4处理能力正在退化，尤其是对问题的分析深度和代码质量，甚至还不如它的前身GPT-3或GPT-3.5。这让人不禁怀疑，OpenAI削减了ChatGPT的算力，或者更糟——大量用户的使用，让其出现了能力退化。

网友发文吐槽大模型变笨

群情汹涌之下，OpenAI的开发者推广大使不得不出来辟谣，GPT-4 API并没有降级，但对于web端却避而不谈。

同样的问题，也出在Anthropic的Claude和New bing上，显然，LLM的商业化还没有完全成熟。另一方面，最近因为AI芯片而估值过万亿的英伟达，也遭到了“罗斯柴尔德”家族的减持，其全球首席投资官投资官表示，减持的原因是AI的估值已经过高，“作为一项投资的话，我怎么都得不出每股400多美元的估值。”

NVIDIA创始人兼首席执行官黄仁勋

而在国内，大模型正在最火热的阶段，自今年3月以来，已有超过20家企业入局大模型赛道。从百度“文心一言”，到阿里的“通义千问”，从商汤“日日新”，到腾讯“混元”，再到京东“ChatJ”、华为“盘古”等等等等。

互联网巨头纷纷秀出“肌肉”，然而这场乱战背后，到底是一场新的技术革命，还是数字货币，元宇宙这样泡沫居多的风口？他到底会把大伙都赶去送外卖，还是通过强AI的又一次技术歧途？要解答这一系列的问题，我们首先要回顾一下大模型的发展史。

02 大模型简史

大模型的起源可以追溯到20世纪80年代，在之后的几十年里，其技术进步一直表现为随着计算机的性能发展，神经网络模型的深度和训练数据的规模缓慢增加。到2006年，随着深度信念网络模型的提出，第一个深度学习模型随之诞生。2017年，Google 团队研发出了Transformer 架构，使深度学习模型参数达到了上亿的规模，这才有了我们现在所见的大数据学习模型。

Transformer架构模型图

可以看出，大数据模型的提出距离现在并不遥远。一开始的大模型，主要也是技术意义，然而为何短时间内从人工智障，变成了风靡全球的人工智能？这中间又有什么惊人的技术进步？答案是，没有。当前业界公认，以ChatGPT为代表的大语言模型并不存在实质性的科学突破。图灵奖得主就曾经发推表示，“大型语言模型并没有物理直觉，它们还是基于文本训练的。”

ChatGPT之所以如此神奇，其核心原因并非是什么新技术，而是量变导致质变。对GPT-3为代表的语言模型研究发现，其性能表现并非随着模型规模增加而线性增长，当模型大到超过特定的临界值，就会涌现出较小模型不具备的能力。或者说得更直白点，当规模上亿的时候，大模型的实用意义几乎没有，15亿规模的GPT-2也只是牙牙学语的婴儿，只有当学习规模扩张到1750亿，令我们惊讶的ChatGPT才真正诞生。

ChatGPT前身GPT-3参数量为1750亿

从技术原理可以看出，大模型并没有突破我们平常理解的技术范畴，距离具有自我意识的超级AI更是还有遥远的距离。其之所以表现得像是有智慧一样，一方面是因为卓越性能，另一方面，则是当人们“看到计算机能表现出理解，就认为它真理解”的伊莉莎心理学效应在作怪，要知道，伊莉莎效应这个名词，诞生于上个世纪60年代的自动对话程序，现在的AI让人感到它似乎有智慧，又有什么难的？

所以大模型的能力，或者至少是大规模应用的能力，是有上限的，因为除了百亿千亿的可调参数，还有十层百层的深度神经网络层数，以及注意力头数，隐藏层大小，都会让其成本几何级增长，所以当收益无法覆盖成本的时候，大模型的能力就来到了上限。

03 大模型，何处去？

大模型并不是真的有智慧，一方面，指望它代替人类工作还并不现实，但另一方面，它也确实是是人类手里的威力倍增器，让原本需要大量人工的辅助工作逐渐消失。其已经让许多人失业，甚至还在让越来越多的人失业，

就以当今比较热门的AI害画师下岗为例，真正的顶级画师会因为AI没饭吃吗？

不会，但是他们作画，本来需要许多人为他们完成素材、画背景乃至上色等工作，而AI绘图一方面帮顶级画师省去这些麻烦，另一方面也让他们的工作效率飞跃性提升，客观上减少了人力需求，这就减少了固定工作量所需要的岗位，产生了暂时性能人力溢出。

AI生成的画作

实际上，这样的情况已经在更多领域出现了，阿里达摩院甚至发布了论文，表示AI工作效率和精准度比专业数据分析师更高，这当然不会让所有数据分析师下岗，但是少量分析师利用AI，完成远比之前更多工作量的未来，已经近在眼前。

所以，大模型是一股挡不住的潮流，因为它带来了效率的切实提升，因此一定会在降低成本的需求下，被推广到全社会的各个行业，全行业的各个角落。

而在这样的趋势下，大模型赛道开始快速分化为三个方向，一是对标GPT的通用大模型，聚焦基础层的公司；二是在开源大模型基础之上训练垂类大模型，聚焦垂直行业；不做研发直接调用接口做产品运营的春应用。

百度智能云副总裁朱勇曾表示，因为算力需求大、训练和推理成本高等原因，研发通用大模型的公司可能“只有那么几家”，但是上面会长出很多专业领域的大模型。在前不久举办的文心大模型技术交流会上，百度智能云也格外强调，百度以文心一言为核心，提供大模型服务，帮助企业开发自己的专属大模型。

可以说，从社会意义上，大模型堪称一场信息革命；然而从技术意义上，它距离强AI等科幻技术，还有大量技术瓶颈，然而我们要知道，大模型诞生也只有6年时间，技术研发是个非常容易产生奇点效应的事情。大模型仍然有着无限潜力。

本文地址：https://www.cknow.cn/archives/25187

以上内容源自互联网，由百科助手整理汇总，其目的在于收集传播生活技巧，行业技能，本网站不对其真实性、可靠性承担任何法律责任。特此声明！

如发现本站文章存在版权问题，烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com，我们将及时沟通与处理。

飞科值不值得入手，飞科突然被全网喷了

上一篇 2023年6月11日 06:35

液晶电视排线卡扣怎么拆图解，电视主板排线卡扣拆解图解

下一篇 2023年6月11日 07:00

科技号

微软云与 OpenAI 竞争 ChatGPT 企业级客户：安全性、老客户、多云、模型迭代效率

1、Zoom接入ChatGPT，但产品表述较模糊包括Zoom、Salesforce、Google最新动态，看得出来ChatGPT正在掀起一轮企业级软件的新竞争态势，意想不到的还包…

2023年3月29日
字节造不出下一个TikTok

“App工厂”字节跳动，造出风靡全球的TikTok之后，一直想在海外复制出下一个TikTok。 5月，根据Business Insider等媒体报道，在美国大力推广其新的生活方式社…

2023年5月16日 • 科技号
ChatGPT是劫杀谷歌的“灭霸响指”？

短短半年，全球巨头之间的AI大战也有了多轮回合了。双方亮剑的频率也是越来越高，就说这两天，ChatGPT再次升级，模型优化、价格下降、公开GPT-4给更多的用户 …… …

2023年6月15日 • 科技号
谷歌Bard支持中文了，十级过关，看懂梗图，直接上手免费体验

前两天，ChatGPT最强竞品Claude升级了二代，谷歌也不甘落后。今天，最新版本的Bard来了，可以在提示中添加图像、自定义回复、新增对40种语言支持。值得一提的是，Bar…

2023年7月14日 • 科技号
科技号

我们和联想智能设备总裁聊了聊PC、折叠手机和MR眼镜 | 36氪专访

联想让手机和电脑真正“卷”了起来。双击电源键，手机屏幕朝纵向徐徐展开，几秒钟就从5英寸（15:9）扩展至6.5英寸大小（22:9）——这是2月底，联想在MWC2023（世界移动通…

2023年4月4日
科技号

告别阿里“大锅饭”，优酷何去何从？

7月4日，一则市场传闻将优酷推上风口浪尖。传闻称，阿里正在对视频流媒体平台优酷和土豆展开战略评估，考虑选项之一，是让优酷土豆将资产注入阿里影业，扩大其业务范围。其他考虑选项则为，…

2023年7月18日
科技号

京东618进军义乌加码「低价武器」，中小商家创业不是「九死一生」

由“鸡毛换糖”起步，在“买商品，卖商品”中快速发展的义乌，是大众眼中的名副其实的“世界小商品之都”。从服装、鞋帽、五金、钟表、玩具，个人生活所需的各种商品，在这里一应俱全。而这庞大…

2023年6月11日
早起毁一天，是真的

俗话说：熬夜一时爽，早起毁一天。所谓「一日之计在于晨」，意思是在早晨闹钟响起的瞬间，就知道，这注定又将是不爽的一天。图片来源：网络特别是前一天熬夜加班到深夜，早上还要打卡刷考…

2023年3月13日 • 科技号
科技号

美国、欧盟签署人工智能合作协议，AI五大领域全面合作

全球首个人工智能合作协议来了！美国、欧盟签署「人工智能促进公共利益行政协议」，针对五大AI领域开展合作，构建互联网未来的新蓝图。从去年一推出就迅速大火的ChatGPT，到正在热映…

2023年4月10日
科技号

能链翟宇博：用智慧能源网助力绿色可持续发展

当前，随着我国“双碳”目标的推进，全社会对ESG可持续发展理念的关注达到了前所未有的高度。ESG（环境、社会、治理）作为一种综合关注企业环境、社会、治理绩效的框架体系和经营理念，正…

2023年6月7日
万字长文详解：大模型时代AI价值对齐的问题、对策和展望

人工智能价值对齐（AI alignment）是关涉AI控制与AI安全的重要问题，随着人工智能的飞速发展和广泛应用，人工智能可能带来的风险和挑战也日益凸显，由此，“价值对齐”问题…

2023年10月12日 • 科技号
科技号

滴灌通澳门交所启动试营运，首批2881家门店DRO融资8.9亿元丨最前线

3月25日上午，滴灌通澳门金融资产交易所（以下简称“滴灌通澳交所”，MCEX）试营运启动仪式在澳门举行。滴灌通澳交所是全球首个收入分成产品DRO（Daily Revenue Obl…

2023年3月25日

大模型：人类未来，还是海市蜃楼？

相关推荐