科大讯飞刘庆峰：讯飞星火的语言理解能力离ChatGPT仅一步之遥｜最前线

2023年5月18日 23:53 • 科技号

5月18日，第七届世界智能大会在天津开幕。会议中，生成式AI再一次成为焦点。36氪获悉，在大会开幕式暨创新发展高峰会上，科大讯飞董事长刘庆峰分享了科大讯飞对当下人工智能的思考和实践，并展示讯飞星火认知大模型的能力及行业应用落地情况。

在刘庆峰眼中，抓住通用人工智能的历史机遇有三个关键点。“首先，必须要在自主可控的平台上，第二，必须要同时做中文和英文，不能只学习中国的智慧，还要向世界学习。第三，在‘硬碰硬’的科技对比上，不仅要学习，还要想办法赶超。”他总结。

本月初，科大讯飞发布了讯飞星火认知大模型。会议中，刘庆峰同样介绍了这一大模型的研发契机。他表示，OpenAI发布的ChatGPT给了团队很大触动，经快速验证后发现，科大讯飞有成建制的力量和完整的算法储备，于是在去年12月15日正式启动了“1+N”认知智能大模型的专项攻关。

“1就是通用的认知大模型，直接对标ChatGPT， N就是各个专用系统，比如教育、医疗、汽车等领域。”刘庆峰解释。

而面对如今生成式AI、大模型的问题，他也直言，目前纯大模型技术还可能出现新知识难以及时更新，事实类问答容易“张冠李戴”，史实、传统典籍等容易“编造情节”等错误。但刘庆峰预计，这些问题在今年会有明显的改进。在具体实践方式上，他认为“大模型本身通过参数记忆和训练，不能从根本上解决，只能用一个办法，调用各种插件来解决可靠性问题。”

整体来看，刘庆峰认为目前讯飞星火认知大模型在文本生成、语言理解和数学能力方面已处于国内领先水平，尤其是数学能力方面已超过ChatGPT。另在语言理解能力方面，讯飞星火认知大模型不仅在国内遥遥领先，和ChatGPT也仅有一步之遥，“100分相比，我们只差两分，而且我们在今年10月份之前就会超过。”刘庆峰说。

以下是刘庆峰演讲全文，供读者参考：

各位领导，各位来宾，非常高兴能够有机会在这里跟大家分享，我们对于如何抢抓通用人工智能历史机遇的一些思考和实践。

认知大模型正成为通用人工智能全新的曙光。通过对海量的数据进行高质量的清洗，再通过统一的神经网络的大模型进行记忆和训练（这个模型通常是上千亿的浮点参数的），再经过人机协作的强化学习等一系列创新方法，就可以实现在通用领域的智慧涌现，可以在一定意义上实现像人类一样的触类旁通的能力。因此，它可以带来不仅仅是内容的生产和分发方式的全新变化、人机交互的根本性变革，也会对我们的科研、办公、工业、互联网带来全新的颠覆和全新的机遇。传统意义上靠堆时长和人力的商业模式，在未来的两三年之内将被彻底的改变。所以有人说它在历史上的战略意义相当于PC和互联网的诞生，我觉得这样的论断是毫不夸张的。

刚刚主持人也说了，4月28日中央政治局专门提出我们要重视通用人工智能的发展，这次通用人工智能从ChatGPT发布的时候给大家分享了48个最主要的任务，科大讯飞对我们人工智能开放平台上400多万开发者团队在通用人工智能相关能力的分析，我们给出了当前通用人工智能的7个底层维度的能力，包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态的七大能力。

科大讯飞在2011年就承建了语音及语言信息处理国家工程研究中心的这样一个任务，其实这一次的认知大模型一定意义上也是对话式通用人工智能，在这方面的语言理解能力、文本生成能力等等，都是跟语音和语言直接相关的，包括大家在两侧看到的语音的转写和翻译能力，现在都已经超过了专业人士。

除了这些进展之外，我们还承担了科技部的认知智能国家重点实验室的重任，所以在此基础上，我们让机器在医疗考试——国家执业医师资格考试笔试中超过了96.3%的参加考试的人类医生，已经可以看1300多种病。在高考和语文作文、四六级英语作文、雅思英语作文中，机器改作文已经比一般老师还要更准。在国际上权威的自然语言理解的比赛——斯坦福大学牵头的SQuAD的比赛（是英文的阅读理解），我们在全球首次超过了人类平均水平。去年又在艾伦研究院组织的Open Book QA的科学常识推理挑战赛上，超过了人类水平。在此基础上，我们看到Open AI发布的ChatGPT给了我们很大的触动和惊喜。经过快速验证之后，我们觉得科大讯飞有成建制的力量、有完整的算法储备，所以去年的12月15号就正式启动了1+N的认知智能大模型的专项攻关。

1就是通用的认知大模型，直接对标ChatGPT， N就是刚才万钢主席专门说到的，在教育、在医疗、在汽车等等方面的各个专用系统。

那么当我们启动研究的时候，我们就想，通用的人工认知智能它涉及到众多的领域，我们要向open AI致敬和学习，同时要快速赶超并努力追赶超越，要有一套科学的成体系的评测方法。所以我们以认知智能全国重点实验室，根据这七大维度提出来了一系列的分解方法，又跟中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨，形成了七大类481个细分任务的关键的测试方法。有这个方法，既可以评测我们自己技术的进步，也可以看到下一步科研的方向，同时可以对各个应用在各个领域里形成指导。

在今年的5月6日，我们就按照这7个维度进行了发布。我们从第一天做就是中英文同步进行的，将来还要做更多的多语种，这个是一个深层次。当然大家可以看到更多的例子，包括比如说对语言理解能力，像这样一个很有意思的男子汉大丈夫，既要宁死不屈，常言又说还需要能屈能伸，在各种场景下它怎么理解？这种理解当然不是一个单点理解，同类的深度理解它全部都具备了这样的能力。这个理解在底层方面来说，对于句法和字词的理解也可以抠到非常精细的维度。

大家今天说深层次AI或者通用人工智能要具备可解释性的底层逻辑，再包括像医疗，刚才万钢主席已经说到了，我们现在机器已经看了5亿多人次的病人，所以可以具备很多的通用的知识。这次通用人工智能，我们没有做专门的医疗方向，因为它要更严肃的才能推给每个家庭。在今年之内，10月份之前我们就会推出医疗专用的认知模型，成为每个人的健康助手和每个医生的诊疗助理。

另外像数学能力、编程能力等等，还有一些当时我们发布会现场大家脑洞大概提的问题，比如怎么把40平米的房间装修成70平米的感觉、到天津三天的旅游怎么制定一个计划等等，那么这些其实都需要这七个维度能力的贯穿。

另外还有多模态，它不光能够生成相关的文字，还可以用语音合成朗读，可以有人物形象。我们现在看到它七个维度的各种能力，除了多模态我们在8月份之前提供，其他六个能力全部都能扫码体验了。

我还想说的是，我们经常会说大模型带来的优势、很多令人惊喜的表现，但是它也有待攻克的缺陷，比如说因为它都是用历史数据训练的，你要问它今年五一情况它就不知道了，对于这些实时的新闻信息它回答不了。可以看到不光讯飞星火，ChatGPT也回答不了，包括对一些事实类问题的张冠李戴，传统典籍的编造情节等等，这个怎么解决？大模型本身通过参数记忆和训练，不能从根本上解决，只能用一个办法，调用各种插件来解决这些可靠性，就必须要有机器，我们的大模型具有超强的语言理解能力。

我很高兴的告诉大家，现在讯飞星火的语言理解能力不仅在国内是遥遥领先的，我们跟ChatGPT仅仅一步之遥，100分相比，我们只差两分，我们在今年10月份之前就会超过。

抢抓认知通用人工智能的机遇，我觉得有几个基本要素。

第一个必须要在自主可控的平台上，我们在天津有非常多的合作伙伴，还有像曙光、华为、寒武纪都在科大讯飞有特战队。第二，必须是第一天就要同时做英文和中文，我们不可能只学习中国的智慧，要向全世界学习，所以中英文同步。我们5月6日这个版本中，不仅数学能力已经超过ChatGPT了，在文本生成中中文超过他，英文以5分为满分，ChatGPT是4.48分，我们已经4.29分。那么还有第三，大家在硬碰硬的科技对比上，不仅要学习，还要想办法赶超。数学能力，编程能力，都属于硬碰硬的能力。现在数学我们已经超过了，还在不断进步，编程现在数据比较少，正在学习，8月份就会对标ChatGPT，所以我们定了目标，10月24日跟ChatGPT相比要在中文中超越，英文中相当。

所以今天在这样一个通用人工智能上，我们也在我们的联合实验室（包括在科大在清华在很多学校），共同在做更前沿的源头技术创新（就像怀部长当年在863专家组一样），一定是要有追赶到超越、再有自己原创的系统性的推动计划。星火也在本次WIC展馆中展出，希望大家有时间去看。

另外关于大模型在各行业落地，我也有一个有趣的例子，大家可以扫码自己去试，比如说英语的全自由的开放式对话，可以选择任何主题。它的对话是完全开放的，每句话都是自动生成的，用语音合成读出来的。

它最大好处就是，任意一个主题选择，就像人一样随机的跟你开放式对答，根据你的回答它随时调整，用语音合成、语音识别和翻译形成了前所未有的虚拟的对话环境，就跟雅思考官跟你对话一样。

当然我们其实在一系列产品中已经有落地了，无论从学习机、办公本，还是我们的讯飞听见网站等等，现在有5000多万人用讯飞听见网站把录音丢过去以后转成文字，有了认知大模型的专业版，它不仅可以转成文字，我们直接告诉它要生成一个宣传文稿、还是广告文案，还是会议纪要、还是代办文件，一键自动生成，极大提升了我们现在的生产和生活效率。包括在汽车，在工业流程跟工业互联网的结合已经有很多场景了。

今天我们对400多万的讯飞开放平台开发者团队，有500多项人工智能能力都在赋能，这次星火大模型的通用人工智能会进一步既为这些开发者赋能，也会让创业者的门槛极大降低。他只要会写prompt，有创意和灵感，很多事情通用人工智能来帮他做了。

我们在天津正在打造北方声谷，现在也已经有了6万多的开发者团队，去年一年新增了35%以上，我们在滨海新区这个楼也有幸成了第一个税收亿元楼，税收过亿，现在整个产值也有100多亿，总共30亩的场地盖了楼，整个产值已经有170多亿了，所以应该说亩均产出也不错。

今天是第七届的世界智能大会，其实从第一届我们就参加对大会充满感情，期待在天津这一块热土之上，相信今天的星火一定可以在天津、在中国形成燎原之势，期待着跟大家精诚合作，人工智能也将因解决人类刚需而被更深刻地载入史册，谢谢大家。

本文地址：https://www.cknow.cn/archives/23155

以上内容源自互联网，由百科助手整理汇总，其目的在于收集传播生活技巧，行业技能，本网站不对其真实性、可靠性承担任何法律责任。特此声明！

如发现本站文章存在版权问题，烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com，我们将及时沟通与处理。

最前线｜李彦宏：AI取代不了人，昆仑芯第三代明年上市

上一篇 2023年5月18日 22:53

专访上交大吕宝粮：情感脑机接口的方向与未来

下一篇 2023年5月19日 00:53

科技号

对话梁正：为什么ChatGPT创新没发生在中国？

壹||ChatGPT是创新生态体系产出的结果，拆解这个生态有几个关键步骤，有创新性的机制，企业走了一条不寻常的道路，聚集了一批理想主义的技术天才，大公司进行了投入和资源整合。我们现…

2023年3月27日
科技号

苹果近十年来最大创新的Vision Pro，能否助推XR+医疗起飞？

在苹果开发者大会（WWDC）2023上，苹果用足足40分钟介绍了Apple Vision Pro混合现实头显，久违地引爆了全场。这是苹果首款XR设备，也是苹果自Apple Watc…

2023年6月23日
科技号

36氪独家丨前理想AI芯片一号位骄旸加入三星，负责组建GPU团队

作者丨邱晓芬编辑丨苏建勋、杨轩 36氪获悉，前理想汽车AI芯片一号位骄旸已离职，目前已加入三星，成为其GPU团队的核心成员，负责项目规划、团队创建。在理想汽车之时，骄旸向理想汽…

2023年4月12日
科技号

日本新技术让光伏面板制造成本减半

京都大学开发出有可能将光伏面板制造成本减半的基础技术（该大学提供）在硅光伏面板领域，制造时需要处于真空状态或达到一定高温，而且需要大型设备，京都大学准教授田边克明等人开发的技术能…

2023年4月25日
科技号

欢迎来到主机策略游戏的黄金时代

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。编者按：在看本篇文章之前，希望大家问自己两个问题：你现在还在玩主机策略游戏吗？…

2023年11月19日
燕之屋IPO“行路难”：食安信任危机待解，还被质疑虚假宣传

时隔十二年，知名燕窝品牌燕之屋再次冲击港股IPO。近日，厦门燕之屋生物工程股份有限公司（下文简称“燕之屋”）正式向港交所递交招股说明书，中金公司、广发融资（香港）为其联席保荐人。…

2023年7月6日 • 科技号
反抗OpenAI“白嫖”，Reddit却先被自家用户“爆吧”了？

不知道有多少人还记得今年4月Reddit宣布对API接口收费的事。省流版回顾是，因为不满意OpenAI和谷歌等公司白嫖自己平台的数据来训练他们的大模型，Reddit准备开始对调用…

2023年6月23日 • 科技号
科技号

2024年，快手为何能成为团购消费的超级风口？

“有钱、有闲，是老铁用户的独特优势。” 3月21日，有间千层创始人康永富在“快手本地生活聚力生态大会”上如此评价快手用户。2023年2月，沈阳90后康永富在哈尔滨开了一家千层蛋糕店…

2024年3月25日
呼吁暂停 GPT-4 研究后，马斯克购买 1 万个 GPU 加入 AI 大战，是在打脸吗？

「我宁愿乐观而错误，也不愿悲观而正确。」马斯克从来不是一个技术悲观主义者。但自 ChatGPT 面世而来，从批评 OpenAI 和微软，到签署暂停研究的联名信，马斯克对 AI …

2023年4月13日 • 科技号
科技号

菜鸟启动上市准备，创业十年交出一份高分答卷｜氪金

5月18日消息，阿里巴巴控股集团发布2023财年Q4财报（2023年第一季度）。其中菜鸟集团成为阿里巴巴“1+6+N”组织变革以来颇受关注的集团。菜鸟不但本季度外部收入增长达到18…

2023年5月19日
日本能否靠水下无人机东山再起？

图片由日本海洋研究开发机构提供日本自负为海洋国家，但海底矿物资源的商业化迟迟没有进展。在水下无人机领域，日本具备顶级技术实力。为实现水下无人机产业化，日本2023年度内将制定相关…

2023年5月29日 • 科技号
ChatGPT当道之日，差异化才是你的生存之道

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。编者按：ChatGPT 的能力让大家惊叹不已。但是作为白领打工人，理性的你应该…

2023年3月12日 • 科技号

科大讯飞刘庆峰：讯飞星火的语言理解能力离ChatGPT仅一步之遥｜最前线

相关推荐