讯飞星火认知大模型：向OpenAI致敬，追赶并超越

ChatGPT与教育 2年前 (2023) lida

62 0 0

文章主题：讯飞星火认知大模型, GPT-3, 人工智能, 评测体系

（文/观察者网周远方）

刘庆峰在5月6日的发布会上强调，我们应当向OpenAI学习并致敬，但同时也要迅速迎头赶上并力求超越，这需要建立一个科学的评测体系。

在一日之内，科大讯飞星火认知大模型成果发布会在安徽合肥成功举行。科大讯飞董事长刘庆峰与研究院院长刘聪共同推出了这一重大成果，并在现场展示了大模型的七大核心能力。此外，他们还宣布了教育、办公、汽车以及数字员工等四个行业的应用成果。

刘庆峰指出，诸如GPT般的通用大模型应具备七项关键能力，包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。经过严格的系统性评估，我国讯飞星火认知大模型在文本生成、知识问答和数学能力三个方面已经超越了ChatGPT的表现。

通用大模型“出圈”，讯飞定义七大维度能力

在2022年的11月30日，Open AI公司推出了ChatGPT，这是人工智能技术的一个重要突破，使得人工智能的应用范围得到了极大的扩展。仅仅两个月的时间，全球范围内活跃的用户数量就已经超过了1亿。这一事件预示着，传统的依赖时长和人力的工作模式可能会被根本性的颠覆。各行各业在面对这个挑战时，有的感到焦虑，有的则积极拥抱，但无论如何，都无法忽视这次巨大的变革和所带来的巨大机遇。

自2018年谷歌推出BERT以来，2020年OpenAI发布GPT-3，已引发我国各机构和企业的高度关注。因此，在ChatGPT引发广泛关注后不久，包括百度、阿里巴巴、360以及商汤在内的中国互联网科技公司在各自的人工智能积累基础上，迅速推出了针对客户端的“类似ChatGPT”模型。这表明，我国在人工智能领域的竞争已经从学术界扩展到了产业界。

在人工智能的浪潮下,认知大模型的质变预示着“智慧涌现”的到来。然而,当前认知大模型的发展仍处于初级阶段,即使是ChatGPT和GPT4这样的模型也远未成熟。此外,通用大模型的展示具有一定的偶然性,因此它们所引发的舆论或资本市场波动未必能够持久。

所以，讯飞特别强调“刚需”。

科大讯飞与中科大共同承建的认知智能国家重点实验室在第一时间就开展对ChatGPT的系统性评价工作，确认了通用人工智能应当具有七个维度的能力，包括：文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面，共分481个维度。这一评价体系与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟的企业形成了广泛共识。

“哪一家企业能率先把大模型的能力深度赋能各个领域的合作伙伴”，刘庆峰强调，“谁能率先找准最解决社会刚需，而又有市场规模，能够自我造血的点，谁就最先能够形成良性循环。……我们相信完全可以复现OpenAI的智慧涌现，中国将成为智慧涌现的第二极。”

“智能涌现”已来，关键在产业落地

多年来，科大讯飞已为“智能涌现”到来的这一天做好了源头核心技术的储备。

2011年科大讯飞便承建了语音及语言信息处理国家工程实验室，“我们提出让机器像人一样能听会说，这一次认知大模型本质上是一次对话式的通用智慧的涌现，语音和语言的核心能力是一个基础条件。”刘庆峰说。

2014年科大讯飞推出“讯飞超脑计划”，明确提出：让机器像人一样能理解会思考。2022年，又升级为“讯飞超脑2030计划”，提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会，让机器人走进家庭。

“在国家平台和讯飞超脑计划的支撑下，过去几年我们在认知智能领域取得了一系列全球领先的成果。”2017年，科大讯飞承建认知智能国家重点实验室，也就是从这一年起，科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生，并且在SQuAD机器阅读理解中全球首次超过人类平均水平，刚刚过去的2022年在OpenBookQA 科学知识推理中，单模型也超过人类平均水平。“可以说多年来，科大讯飞已在认知智能领域有了丰富的储备和积累。”

“现代的医疗领域，我们几十亿参数的小模型系统，当时就比GPT3要强，所以起初并没有做大模型，”刘庆峰在采访中表示，但是ChatGPT推出后，我们发现很多惊喜。

因此，在ChatGPT推出后不久的2022年12月15日，科大讯飞正式启动“1 N”认知大模型专项攻关，其中“1”就是指通用认知智能大模型，“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

值得一提的是，科大讯飞本次没有在发布会上推出备受期待的医疗大模型。对此，刘庆峰表示：“医疗专业领域的模型因为需要相关法规，所以我们应更加谨慎。下一步我们会跟医疗机构合作后，把医疗专业知识放在通用大模型当中。”

他还透露，科大讯飞将会在今年的1024开发者大会上正式对外发布医疗大模型。

算力短板算法补

另一个广受关注的领域是国产人工智能的算力支撑。

对此，刘庆峰在采访中表示：“我们与华为、曙光等国产平台，在算力和操作系统方面都有系统性的对接。这一轮通用人工智能认知大模型的研发竞争中，在算力这个要素上我们是处于劣势的。”

“但是我们觉得两件事情是确实很有价值，第一，我们在研究，如何在算力落后一代的情况下，实现相对接近的效果。我们现在可以在算力小很多、模型小很多的情况下，在很多维度上实现类似效果。”刘庆峰说，“第二，openAI的CEO奥特曼说过，大模型来到GPT4的规模后，再增加更多的算力，做更大的模型，提升效率有限，要把各个子模型协同联动起来，才代表未来。这也是我们在去年12月15日启动专项公关时就确定的技术趋势。”

今年以来，科大讯飞股价累计涨幅已经超过70%。星火认知大模型在周末发布后，科大讯飞今日再度迎来大涨，截止发稿，股价仍封于63.86元/股的涨停板上，市值约1483.5亿元人民币。

本文系观察者网独家稿件，未经授权，不得转载。