文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

文心一言 2年前 (2023) lida
53 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

在AI大赛道上,需要的是长跑选手。大模型的结构都不复杂,关键在数据,因此相比于纯粹的AI企业,百度这类有着海量数据的企业更让人看好。

作者|杨知潮

编辑|原 野

微信公众号:略大参考(ID:hyzibenlun)

从2月7日宣布产品名称,到3月16日正式邀请测试,文心一言的面世仅仅用了不到两个月。

速度的背后,是外界对百度的期待。

一方面,AIGC的火热把百度再度推向科技舞台的中央,文心一言的邀请测试成为众望所归,它所承担的,不仅仅是百度一家公司的信心与野望。同时,它有足够旺盛的市场需求。不到两个月的时间里,文心一言拥有了650位合作伙伴,据了解,截至3月17日12点,申请文心一言API调用服务测试的企业已达8万。邀请测试当天,五家企业与之签约,还有数万家企业在排队申请使用。

对商业潜力的信心很快传导到资本市场,3月17日,百度港股一度大涨超过13%。

中国企业对AI的投入已经持续多年,但很长时间都是赔本赚吆喝的买卖。举个例子:国内头部AI企业旷视科技,在2021年一度有七成收入来自卖摄像头等硬件。说白了,AI服务还没有实现大众化。

文心一言的出场方式,由此显得尤为特别。

自带订单面世,让它首先赢在了起跑线上。接下来,就是每一次科技创新落地都要经历的那些故事:更多的投入、更广阔的市场、更蓬勃的野心,当然,难以避免地,还有不知道什么时候会钻出来的挫折,以及随之而来的嘲讽。

毕竟,在人类科技进步的历史中,没有一项新技术的落地,是完全一帆风顺的。

01 不算完美

即使对于百度这样的成熟科技公司,文心一言也是足够特别的产品——它或许是第一款在“不算完美”的状态就被推出面世的百度产品。

3月16日,几乎整个科技圈的关注点都在文心一言的邀请测试会上,有现场记者感慨:很久没有在邀请测试会现场感受如此紧张的氛围。特定的时代与技术背景之下,文心一言在不同人眼中有着不同的意义。

从功能上看,文心一言做到了“人有我有”,即同时拥有逻辑推测能力,文案写作能力、文学创作能力、多模态处理能力等生成式AI的基本能力。

商业文案方面,文心一言完整演示了为一家公司定制创作了名字、slogan、以及一篇600字的新闻稿。逻辑推算方面,在面对经典的鸡兔同笼数学题里,文心一言能够识别题干是否正确,并用方程式给出题解。文学创作上,文心一言对知名小说《三体》提出了五个续写的角度。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

当然,文心一言真正的优势,还是对中文的理解。比如,它可以针对“洛阳纸贵”这种容易产生歧义的成语,给出较为贴切的解释。它甚至用成语写出了一首藏头诗,还用四川话读出了一篇文章。

一方面,这是百度必须修炼的肌肉。据百度首席技术官王海峰介绍,文心一言在中文适配方面做了大量精调,也标注了更多的数据。一方面,最好的中文产品,这也是百度的基因所在。在搜索引擎的时代,百度和谷歌的技术不分上下,然而在本土化上,百度做得明显更好,无论是对中文的适配,还是对中国市场需求的适配都明显超过谷歌、雅虎、必应这些海外玩家。

文心一言实现了一脉相承。李彦宏表示,“作为一家根植于中国市场的公司,我们理应在中文的理解,和中国文化的理解上,超出世界上任何一个大模型。”当然,他也坦诚,从内测阶段体验到的文心一言能力来看,“确实不能叫作完美”。

这样的坦诚,反而让更多人看好文心一言的潜力。

毕竟,技术自信依托的从来都是产品。对于文心一言这样的大语言模型,邀请测试只是开始,用户的使用与反馈,会加快其后续的迭代速度。而中文语料的丰富程度,相当于一座富矿。

对于追求产品至上的百度,把一款不算完美的产品推向市场,算是稀罕之举。原因很简单:响应市场需求。李彦宏提到,百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。

邀请测试会后,“略大参考”也第一时间体验了文心一言,一部分答案超出预期,大部分答案都能给出系统性的分析,部分观点还很新颖。至少在中文层面,产品的完成度比较高。比如针对”小鹏为什么卖不过理想“这一问题,文心一言从品牌、产品、市场、价位等多方面对两家车企进行了分析,也提到了差异化、堆料、高端化这些当下市场的热点问题。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

02 需求

AI 世界最不缺的就是热度。每隔几年,现象级产品都能带来全球范围内的AI热,但这种热度往往在短期消散,只有资本留下的一地鸡毛。

困扰AI的最大问题,是应用。

以最近的一次AI热为例。以AI四小龙为代表的国内AI企业投入百亿级别的研发资金,然而先进的AI技术却无法找到实际的应用场景,只能在人脸识别、安保系统这些少数领域里拿到订单,有时甚至要靠卖摄像头赚钱——旷世科技在2021年递交招股书中,卖硬件的收入占比超过了7成。

正因没有应用场景,AI企业往往都顶着极高的市收率:商汤科技目前市值超过800亿,但去年上半年收入仅为14.2亿元,还没有研发费用多。

但这种规律,或许会被这波AIGC所打破——这也符合人类文明螺旋式上升的整体规律。总有一些节点,是直接被标记的关键。从硅谷到北京,AI 热潮重新激活了整个科技行业。

区别于此前的多轮AI热,文心一言等产品,在出生之际就找准了极其广阔的应用场景。它不需要被输血,自带的造血能力,反而可以赋能其他产业。

订单说明一切。早在百度刚刚公布文心一言产品的2月份,就有近300家各行业大公司成为合作伙伴。如今,已经有650家企业宣布接入文心一言生态。还有更多的企业在排队,据百度透露,申请文心一言API调用服务测试的企业已突破6.5万。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

图:部分接入文心一言的企业

在经济前面复苏的2023年,AI魔法被赋予了更多的期待。

比如车企。如今,智能座舱已经成为新能源汽车的标配,高端汽车品牌都将重点放在了智能化上,其中,人机交互是智能化的绝对重点。通过生成式AI的对话能力,智能座舱能将人机交互的体验一个台阶。与文心一言的合作,成为各大车企提供差异化服务的契机。

更大的想象空间在自动驾驶上。文心一言拥有类似人类的逻辑推理能力,有机会解决当下自动驾驶的许多问题,很可能是人类通向L4级别自动驾驶的密码。在今年2月的电动汽车百人会论坛上,中国科学院院士欧阳明高也谈到了这一点,他认为语言大模型会对自动驾驶会产生深远影响,解放很多测算门槛,加速赛道发展。

不止车企,很多互联网企业需要使用AI,为用户提供更好的服务。比如携程打算与文心一言在旅行智能规划领域进行合作,用AI为用户提供类似生成行程的旅游服务。

合作方还包括大量媒体。公开资料显示,目前已有30家媒体与百度进行合作,其中不乏上海报业、界面新闻这样的头部媒体机构。此外,信泰保险希望借助文心一言,为客户提供自助办理保险业务和客服服务——从600多家合作伙伴的名单中不难看出,几乎所有需要面向人类客户的企业,都可以通过AI解放人力,提升服务效率和质量。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

回到百度内部,文心一言也能成为很多业务的加速器。

比如搜索业务,可以说是AI的天然使用场景。百度早已上线了AI搜索框,2009年,文心大模型就为百度搜索带来了排名改进和多模态搜索能力。文心一言接入后,搜索引擎不再只是资料的整理者,而是能够自己生成答案,这将彻底颠覆原本的搜索服务模式。

百度移动生态下的创作者,也是文心一言的直接受益人。百度的创作者对AI有着重大需求。在百家号中,每一天都有上万篇文章通过AI技术转化成视频。而文心一言既生成文字,图像,也有视频,将大大提高创作者的效率。

百度的第二增长曲线是智能云,这是百度当下最主要的增长动力,也是可能从文心一言产品受益最大的业务。根据百度的规划,文心一言将通过智能云对外提供服务。

模型即服务。李彦宏十分看好文心一言在云服务上的前景,他认为,生成式AI将颠覆云服务,“未来的云服务,都将建立在大模型之上。”

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

至于百度最近几年持续发力的自动驾驶业务,文心一言未来可能还会搭载在 Apollo 智舱系列产品中。到目前为止,全球自动驾驶功能与大模型之间的联动还比较少,短期的商业潜力还有待观察。但作为自动驾驶技术领先者,百度已经提前做好了准备。

03 技术

全世界的科技热情被AIGC点燃,对于百度这种具备极强技术基因的公司而言,是一次重新站上全球舞台中央的机会。

对于想要搭上AI快车的合作伙伴,它提供了一张张具体可见的“车票”。

百度的底气,依然是技术。关于这家公司对技术的狂热,太多数据都可以提供证。比如,在过去10年里,百度已经投入1000亿元做研发,由此带来的收获是:在面对生成式AI的四层技术栈,从芯片层,到框架层,到模型层,再到应用层,百度都掌握了核心技术和资源。

在芯片层,百度有自研的昆仑芯片。该芯片已经实际部署了数万片,经过了应用层面的考验。在框架层,百度有自己的飞桨深度学习框架。根据去年5月百度公布的数据,截至目前,开发者535万,服务企业20万,创建模型67万。在模型层,最具代表性的就是刚刚邀请测试的文心一言。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

图:基于飞桨深度学习平台,百度打造的产业级知识增强文心大模型。

作为一家同时拥有B端和C端业务的企业,百度在应用层掌握的海量数据,也构成了它的核心优势。

正如李彦宏所说,语言大模型是算力和数据的“暴力美学”,只有当训练的数据达到一定规模的情况下,才会出现智能涌现。比如文心一言共学习了5000亿条的知识图谱进行知识增强,这是规模较小的企业甚至很多大厂都不具备的条件。

暴力美学之下,必须有“家产”支撑底气。

作为全球最大的中文搜索引擎,百度积累了多年的中文语料,百度App超过6亿的月活积累的用户数据,百度搜索每天几十亿次的搜索行为,这些数据能够提供最真实的反馈,从而倒逼大模型的优化。而这样的数据资源,在全世界也没有几家公司可以比拟。从事语言大模型研发的耿杰博士曾对“略大参考”表示,大模型的结构都不复杂,关键在数据,因此相比于纯粹的AI企业,他更看好百度这类有着海量数据的企业。

这也是部分客户选择文心一言的原因。有合作伙伴表示,许多AI公司都有类似的布局,但相比之下百度拥有海量的数据和技术积累,这是它的天生优势。

在AI的大赛道上,百度是位长跑选手。它在2017年宣布“All in AI”时,质疑的声音一度将它包围。身为一家上市的商业公司,投身到商业前景尚不明确的AI赛道,不失为冒险之举。

不被理解的孤独,或许就是先行者的宿命。好在,文心一言不必在暗夜中独行,首批650位合作伙伴,已经为它点亮了出发的路。

文心一言助力,企业如何利用AI知识引擎?飞桨+百度文心大模型,开启产业知识新篇章!

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

相关文章