百度吴甜:新版文心一言能力已超ChatGPT 3.5,未来只会有少量大模型

文心一言 4个月前
10 0 0

新浪科技讯 7月24日下午消息,近日,IDC发布AI大模型技术能力评估报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一。在面向新浪科技等媒体沟通中,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出,新版本文心一言3.5已超越ChatGPT 3.5,未来国内将只会有少量大模型。

“在OpenAI发布ChatGPT之前,真正在做大模型的企业或机构寥寥可数,过去短短几个月内,大量新的模型出现,这是一个阶段性的现象,在演变的过程当中,其实各个企业、机构会逐渐找到自己的定位,下一步逐渐会走向自己细分的方向。”吴甜表示。

在吴甜看来,大模型的终局将会集中在少量几个大模型上。因为,真正从底层做起来的大模型成本非常高,并不是想做就能做起来的,它需要有多年的积累,需要非常综合的能力,也需要有绝对的坚定信心,一直投入下去才能够做好。所以,从这一点上可以看到,将来只能有少数的大模型。

吴甜指出,大模型产业化面临着挺大的挑战,总结起来有三方面:第一,大模型的体积确实很大,模型大带来的训练难度高,成本高。第二,对于算力规模要求非常大,性能要求非常高。第三,数据规模也很大。我们今天为什么有这么多千亿参数规模,甚至也有万亿参数规模,它跟海量的数据上自定义强相关。数据的规模也非常大,收集、挖掘、建设、筛选这些数据,清洗这些数据本身也是非常大的大工程。

“其实完全不要存在大量的大模型,而对于应用者来说,也不需要每一个应用都来进行大模型的开发。”吴甜表示。在他看来,大模型的产业模式,可以类比芯片代工厂,现在芯片的型号、厂商非常多,但是代工厂只有几家而已,芯片代工厂价值非常大,但整个社会不需要有非常多的企业都来实现这个能力,只要少数几家芯片代工厂,对于有芯片生产需求公司来说,只要出生产方案,交给芯片代工厂生产,就可以得到想要的芯片。(文猛)

相关文章