百度“国产ChatGPT”背后的技术支撑

文心一言 2年前 (2023) lida
84 0 0

近期,国外和国内两大“ChatGPT”产品正呈现两种截然不同的状态:怀疑和坚定。

国外掀起了全球范围内对人工智能的讨论,其中ChatGPT的出现备受关注。最近,马斯克在社交平台疯狂吐槽ChatGPT带来的混乱现状和其背后AI公司Open AI背离初心。这主要因为马斯克始终认为AI会对人类生存构成威胁,且并不赞同Open AI将ChatGPT商业化的行为。

再看国内。与马斯克持有完全不同理念,国内众多企业对AI聊天机器人蜂拥而入,勇敢且坚定地拥抱“ChatGPT”,并对其寄予厚望。比如,作为国内首个推出号称“国产ChatGPT”AI聊天机器人——文心一言产品的百度,其锋芒最为夺目。

眼下,宣布接入百度文心一言产品的企业纷至沓来。据相关数据显示,已有近300家头部企业宣布加入百度“文心一言”生态,其中包括互联网、媒体、金融、保险、汽车、企业软件等行业。车企的加入尤其引起了广泛关注,这也使百度成为该领域关注度最高的企业。

然而,上述现象也难免令人生疑:在产品尚未面世并且经过实际应用检验的情况下,百度文心一言能在如此大范围内受到热捧?这究竟是一场带有“虚火”的营销,还是百度与用户企业的互相成全?在众多企业中,百度又为何将文心一言搭载的重点对象瞄准车企?

此外,为什么国内资本市场鲜有声音关注应用AI聊天机器人的安全问题,或者讨论其商业化的可能性?这是否意味着相对于Open AI的ChatGPT,国产AI聊天机器人的智能能力或许还不足以造成人类社会的混乱?甚至商业化之路也是遥遥无期?

百度“国产ChatGPT”背后的技术支撑

图源:百度

做“国产ChatGPT”的底气

不得不否认的是,在GPT热潮席卷国内资本市场的时候,百度是第一个表示要即刻推出“国产ChatGPT”的企业。

在坦然的声明背后,是百度长期在人工智能领域的技术积累。

实际上,ChatGPT是一个积累已久、有着特殊训练方式的大模型。从技术角度来看,ChatGPT是基于大规模预训练语言模型(GPT-3.5),借助其强大的语言理解和生成能力,通过在人工标注和反馈的大规模数据上进行学习,并通过自然语言处理(NLP)理解一种或多种人类语言,从而能够给出更好的回复。

百度长期致力于大数据积累、AI分析和自然语言处理能力的研究和应用,这些领域正是百度相对擅长的。因此,ChatGPT的成功,是百度在这三个领域的综合作用的结果。

自然语言处理是百度在AI领域的重要分支。百度于2010年专门成立了百度自然语言处理部,致力于研究和开发自然语言处理技术。在近年来的发展过程中,百度自然语言处理技术不断创新,并在一些重要领域取得了显著的成果。例如,在2021年9月,百度发布了中英文对话预训练生成模型PLATO-XL,成为全球首个百亿参数大模型,为对话AI技术的应用打开了更广阔的想象空间。这一成果展示了百度自然语言处理技术的强大实力和领先地位。

百度是中国唯一一家拥有全栈AI技术架构的公司,在芯片层、框架层、模型层与应用层都有关键自研技术。这种技术能力让百度成为了中国AI领域的佼佼者,在语音识别、图像识别、自然语言处理等方面取得了显著的成果,并在全球范围内建立了广泛的业务。

中信证券曾在研报中提到,百度基于自身AI需求,研发了针对人工智能的芯片产品昆仑芯,专注AI技术,在体系结构、芯片实现、软件系统和场景应用均有深厚积累。据悉,昆仑芯拥有10亿左右用户的数据,而且没有那么多隐私限制,对于人工智能开发来说,这可能和硬件同等重要。

百度以搜索起家,围绕数据而生,自2000年以来积累海量大数据。这些数据是任何自媒体平台都无法获取的历史内容,也是所有APP无法得到的时空资源。这也是2015年百度成功切入自动驾驶赛道的重要原因之一。当时,宝马看中了百度的地图、语音识别系统等能力,并与百度达成合作。由于百度本土的数据,它能够适应中国复杂的路况,这是欧美IT公司很难做到的。

百度长期积累的大数据资源已经服务于文心一言。早在2019年,百度就做出了文心 ERNIE 1.0,其积累的大规模知识和海量多元数据,让该产品得以快速发展。搜索业务为大模型所需要的庞大数据训练量带来了天然的便利,百度因此成为了文心一言的合作伙伴。

据悉,2021年,ERNIE 3.0大模型即拥有千亿参数;与超强算力方联合的鹏城-百度·文心作为一款融合了自然语言理解和自然语言生成的大模型,其参数量达到了2600亿,相对GPT-3和ChatGPT提升了50%。

百度尝到了自动驾驶的“甜头”

实际上,即使在ChatGPT猛烈出圈之时,仍然有很多对于这类系统的具体功能及应用是迷惑的。更难以想象它将如何与汽车相结合。但是,百度想到了这一点,这主要与百度智能云业务的发展态势和智能驾驶解决方案对其业绩贡献有关。

百度预计将在2月22日公布其年度财报。有观点认为,百度2022年财报或带来重要转折。首先是看业绩的确定性,可以从利润表中观察疫情冲击对公司基本盘的影响;其次是看新曲线的成长性,尤其是百度文心一言的进展情况。

根据格隆向机构对云业务等数据的乐观预测,最终的业绩数据可能反映一些新的变化。比如,云业务等新曲线的快速增长,将进一步印证百度基于搞研发强度的高成长性,引导市场进一步重估百度的长期价值。

截至2022第三季度,百度智能云的市场份额居全球第四,收入增速亦高于云市场大盘。其中,智能驾驶是百度智能云板块中至关重要的一部分。

百度“国产ChatGPT”背后的技术支撑

图源:百度Apollo官网

数据显示,2022年第三季度,智能驾驶业务方面,百度Apollo汽车智能化解决方案近期其累计定点及签约金额预计达到114亿元。财报发布后,百度CFO罗戎在电话会议中表示:“汽车解决方案方面,我们还提到了一个预估,那就是达到114亿元人民币的累计销售,现阶段收入贡献仍然很小,我们预计从明年下半年或2024年初开始,随着采用我们解决方案的小型汽车上市,收入将会增加。一旦有了可观的收入,这项业务应该会开始盈利。”

百度汽车智能化解决方案已经在全球30多个汽车品牌的130余款车型上实现量产,累计搭载超过700万辆。

百度自动驾驶方面负责人向媒体透露,截至2022年第三季度末,百度Apollo自动驾驶出行服务平台“萝卜快跑”向公众提供的乘车次数已累计达到140万,是全世界最大的自动驾驶出行服务商。随着文心一言在百度自动驾驶方面的应用,将进一步加速推进百度自动驾驶的落地和服务的增长。

车企相信文心一言吗?

近几日,长城、吉利、红旗、零跑、东风日产启辰、岚图、爱驰、极度、海马等多家汽车品牌纷纷官宣接入。后续,这些车企将全面体验并在汽车生态领域接入文心一言的能力,推进智能汽车交互的再升级。

百度“国产ChatGPT”背后的技术支撑

图源:百度Apollo微信公众号

值得注意的是,在上述车企官宣文案中,“加速智能网联汽车再进化,开启人工智能时代的汽车全新体验”这句话屡见不鲜。

或许,迫切的智能化转型,也是众多车企在还未见到文心一言面世的情况下便纷纷宣布接入的原因之一。要知道,如今的智能座舱语音交互系统并不完善。

智能语音交互主要有三大重点,分别是:识别、理解和执行。根据盖世汽车研究院的行业观察,在目前提供解决方案的厂商中,行业的痛点主要聚焦于“理解”部分,大部分的车载语音交互系统在“理解”上并不智能。

如何让车载语音交互系统像人一样理解我们的话语?这主要涉及到自然语言处理技术,它们对于用户输入语音的理解与本身的场景策略、多轮对话有着密不可分的关系,并直接决定着车载语音交互系统的智能化程度。而自然语言处理,正是百度文心团队重点攻克的技术之一。

车企陆续宣布接入文心一言并非盲目跟风,除了对百度技术积累的信任,更多的是希望从该产品中能够得到启发。

车企合作方认为,科大讯飞、商汤等也在做相似的布局,但相对而言,百度能提供别家不可比拟的数据优势。然而,有人认为,就百度目前的技术而言,文心一言没能在自动驾驶等智能化重要领域发生太大作用,只停留在体验的交互层面。

百度“国产ChatGPT”背后的技术支撑

图源:百度Apollo官网

集度智能驾驶负责人此前谈到,关于集度将引入汽车的百度文心一言大模型,现阶段将用于语音和对话方面,未来不排除把该模型融入自动驾驶的数据生成工作中。更有车企表示,文心一言只是一项能力,车企会在这项能力的基础上,结合自身智能化场景需求,做一些针对性的产品开发。

车企想要的不仅仅是文心一言产品本身,更重要的是通过技术能力来帮助和促进汽车智能化的发展,为更多的汽车智能化产品提供灵感。

当然,眼下,文心一言的具体上车时间尚未确定,也没有实际案例验证其与此前语音助手之间智能化的本质区别,更不要谈其商业化能力究竟能为百度带来多少收益。

百度和车企似乎主要心思在于拓展新的业务可能性,例如百度与车企合作推出文心一言智能聊天机器人,车企则希望借助该机器人深入的智能化开发。可以确定的是,在国内科技企业中,AI聊天机器人这个生意,百度和车企都有实力去做。

关键词:ChatGPT,OpenAI,马斯克,人工智能,企业,百度,文心一言,车企,企业软件,互联网,媒体,金融,保险,汽车,企业软件,自动驾驶,数据,AI分析能力,自然语言处理能力,大数据积累,AI技术能力,百度,自动驾驶,车企,文心一言,用户企业,企业合作,技术积累,商业化能力,自然语言处理,语音助手,智能化,汽车智能化,自动驾驶,数据训练量,百度云,智能驾驶,车企合作,自动驾驶技术,数据隐私,AI隐私,数据安全,企业社会责任,言论自由,言论自由,言论自由,言论自由。

版权声明:lida 发表于 2023年3月15日 pm6:44。
转载请注明:百度“国产ChatGPT”背后的技术支撑 | ChatGPT资源导航

相关文章