星火大模型预计 10 月底在中文上超越 ChatGPT。
来源|多知网
作者 |Penny
图片来源 | 科大讯飞官网
多知网 5 月 11 日消息,科大讯飞星火大模型发布后于 9 日和 11 日连续举办了两场投资者活动,透露了星火大模型的商业落地规划,相应的时间节点,回应了相关” 套壳 OpenAI 的 ChatGPT” 的问题。
科大讯飞提到,在发布了星火大模型后,首批来自 36 个行业的 3000 余家企业开发者已经达成了明确的合作意向。
针对网上有谣言说讯飞星火大模型 ” 套壳 OpenAI 的 ChatGPT”,科大讯飞回应称:既不符合事实,也不符合逻辑:如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比 ChatGPT 还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。
科大讯飞透露,接下来星火大模型的具体迭代周期是:
6 月 9 日:突破开放式问答(即实时问答),通过类搜索插件获取知识,以更人性化的方式呈现。此外,升级多轮对话能力,数学能力还会再上一个新的台阶。
8 月 15 日:升级代码能力,让开发者、合作伙伴高效方便使用,讯飞内部已经在使用代码生成能力。同时,多模态交互能力正式开放给客户。
10 月 24 日(科大讯飞全球开发者节):通过科学、系统的评测方法在通用认知大模型能力上能够对标 ChatGPT,在中文上超越,在英文上达到跟它相当的水平。
以下为投资者活动问答实录 ( 为方便阅读,多知网将两次投资者活动进行了整合 ) :
问:讯飞星火大模型的相关情况,具体在商业落地上如何规划?
答:1、星火大模型是科大讯飞在人工智能领域长期深耕而产生的技术复利效应。基于科大讯飞在认知智能领域超过十年的积累,讯飞星火大模型经科学、系统的评测,在国内可测的现有系统中处于领先水平;
2、星火大模型带来公司已有产品的竞争力提升和用户体验的显著改善,进一步提高了产品的刚需属性,还提供了公司参与互联网产业格局重塑的新机遇;
3、5 月 6 日发布会上现场展示的学习机、办公本、录音笔、听见,以及汽车人机交互、数字员工等具体的产品,均已实现了星火大模型的商业模式落地。
相关产品应用星火大模型的技术成果后,销量显著提升。除了赋能自身产品外,讯飞会继续开放 AI 能力,联合各行业合作伙伴面向多个行业共建大模型 ” 星火 ” 生态。本次发布会首批来自 36 个行业的 3000 余家企业开发者已经达成了明确的合作意向。
问:当询问讯飞星火,” 你是谁 ” 或者 ” 你和 OpenAI 的关系 ” 时,经常会错误出现 ChatGPT 相关的信息,请问原因是什么,如何改进?
答:1、这是大模型常见的模型人设问题:大模型不坚持自己的观点,对于一些客观的事实,会听从用户的意见,受到用户干扰。这是现有大模型的已知和常见问题。也有投资者截图反馈给我们 GPT 对于 “gpt-4 是谁开发的 ” 的答复为 “gpt-4 是由科大讯飞公司开发的 “。
讯飞星火认知大模型为公司自主研发,使用了海量数据训练,但由于 ChatGPT 比较火,训练数据中出现较多 OpenAI、ChatGPT 等词汇,因而在有些问答中会错误地出现以上信息。
2、网上有谣言说讯飞星火大模型 ” 套壳 OpenAI 的 ChatGPT” 既不符合事实,也不符合逻辑:如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比 ChatGPT 还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。
3、公司研究团队正在积极解决该问题,预计 6 月 9 日的版本在这类问题上会有大幅度改善。
问:公司 ChatGPT 相关技术在算法方面的优势?
答:1、科大讯飞构建了一支成建制的、行业顶尖的研发团队。主主导星火大模型研发的主力部队多是 85 后、90 后,既年富力强,也多在一线拥有 10 年以上的专业研究经验,其中有两位员工甚至入选《麻省理工科技评论》”35 岁以下科技创新 35 人 ” 榜单,这是中国乃至全球科技领域的最高荣誉;
2、依托科大讯飞唯一一家承建认知智能全国重点实验室,在 Transformer 深度神经网络算法方面拥有丰富经验。已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平,2022 年在认知智能技术领域累计获得 13 项世界冠军;2022 年 7 月,科大讯飞既创新提出了大模型与知识融合统一的理解框架 X-Reasoner,有望弥补大模型的模糊记忆技术短板;
3、算法的创新要依托具体的应用持续场景迭代,科大讯飞在认知智能方面开拓了丰富的应用场景。例如教育行业的因材施教和个性化学习、医疗行业的人工智能辅诊、智慧城市的便民便企服务、面向企事业单位的智能办公等等,过去 3 年已实现合计超过两百亿的毛利额。
问:目前市场上有一些测试集来验证各家大模型的效果,现在是否有相对权威的测评体系?
答:一套科学、系统的评测体系是非常必要的,认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖 7 大类 481 个细分任务类型。
主要包括:1、多风格、多任务的长文本生成能力;2、多层次跨语种语言理解;3、泛领域开放式知识问答;4、情境式思维链逻辑推理;5、多题型可解析数学能力;6、多功能多语言代码能力;7、多模态输入和表达能力。
问:5.6 发布会以后,讯飞星火大模型后续持续的里程碑目标?
答:5 月 6 日发布会上刘庆峰董事长已经提到,各家大模型技术均仍存在有待攻克的三类技术缺陷:新知识难以及时更新、事实类问答容易 ” 张冠李戴 “、史实传统典籍等容易 ” 编造情节 “。
发布会后,我们将持续升级迭代,具体里程碑:
6 月 9 日:突破开放式问答(即实时问答),通过类搜索插件获取知识,以更人性化的方式呈现。此外,升级多轮对话能力,数学能力还会再上一个新的台阶。
8 月 15 日:升级代码能力,让开发者、合作伙伴高效方便使用,讯飞内部已经在使用代码生成能力。同时,多模态交互能力正式开放给客户。
问:公司教育业务发展情况?
答:1、科大讯飞区域因材施教项目是全国唯一一家有实际案例、实际数据效果验证的厂商,重大项目实现了 100% 规模化教学质量提升;基于良好的应用成效,已经逐步延伸到二期、三期项目,呈现出向周边区域辐射效果;
2、G 端业务的规模化应用及其良好的应用成效,进一步形成了良好的 GBC 联动效应;
3、讯飞 AI 学习机真正拥有因材施教、个性化分析的 AI 能力,真正能够减负并增效,市场份额和品牌知名度持续提升,NPS 值持续保持第一。
问:请问学习机的发展情况?
答:科大讯飞 AI 学习机自上市以来,得到用户和行业的高度认可。在竞争激烈的学习机行业中,科大讯飞 AI 学习机市场份额和品牌知名度持续提升,用户净推荐值 NPS 持续保持行业第一。今年发布的 AI 学习机 T20Pro 全新上市,为 3-8 岁、8-12 岁、12-18 岁的孩子分别匹配启蒙益智精准学、自主辅学精准学、学业提升精准学,通过环环相扣的 ” 个性特征识别 – 自主闭环学习 – 真实效果反馈 ” 三大模块帮助孩子减轻学业负担、提升学业水平,实现闭环且螺旋上升的自主学习。5 月 6 日,科大讯飞 AI 学习机 T20Pro 作为认知智能大模型技术率先落地的产品之一,进一步提高了产品核心竞争力,销量显著增长。
相关阅读:
转载请注明:科大讯飞回应星火套壳 ChatGPT:既不符合事实,也不符合逻辑 刘海峰:高考这十年,成就可圈可点 进步很大 | ChatGPT资源导航