大模型产业新进展:百度文心如何革新搜索与应用?

文心一言 2年前 (2023) lida
45 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

百度最擅长、最知名的搜索,要“变味”了。

因为这一次,他们决定把大火的大模型也丢进去做成产品了。

大模型产业新进展:百度文心如何革新搜索与应用?

这个大模型,就是百度自家的“最强兵器”——文心大模型

AI大模型应用在搜索场景,带来的新产品则叫做文心百中

好奇的小伙伴肯定要问了,那它跟我们传统搜索会有什么不同呢?

举个例子。

针对“山城是指的哪个城市”这个问题,传统基于关键词搜索的结果可能会是这样的:

大模型产业新进展:百度文心如何革新搜索与应用?

(注:“相关度”采用ES默认计算方式,分值为0~1区间,分值越高说明模型认为结果越符合检索需求)

但很显然,传统搜索的结果并不是我们想要的那个答案。

而这个问题到了文心百中手里,得到的答案就通灵了:

大模型产业新进展:百度文心如何革新搜索与应用?

(注:置信度由百中搜索模型计算得出,分值为0~1区间,分值越高说明模型认为结果越符合检索需求)

这只是文心百中在“知识搜索”里的能力展现,它对于开发者还制定了特定的搜索功能。

例如在“开发者搜索”里输个“Java”,会得到这样的结果:

大模型产业新进展:百度文心如何革新搜索与应用?

🔍 当你进行搜索时,你会发现结果的确呈现出高度的专业性和深度,充满了纯粹的技术气息。👀 每一条信息都像一本微型百科全书,详尽解析着复杂的概念,或是引荐那些在开发者社区中备受推崇的GitHub项目。🌐 官方网站的信息也同样丰富,它们是技术探索者们的指南针,引领你深入理解产品的核心功能和最新动态。这种搜索体验就像是踏入了一个技术的海洋,每一页都充满了知识的泡沫,等待着被解读和吸收。📚 但请注意,这里没有联系方式或个人品牌,我们的目标是纯粹地提供信息,帮助你在这个领域中找到你需要的答案。🎓SEO优化提示:使用关键词”技术流搜索结果”、”GitHub项目推荐”、”官网深度解析”等,适当增加行业术语和长尾关键词,以提高搜索引擎排名。

但纵观文心百中所涵盖的其它领域,一个非常明显的特点就是很To B。

换言之,它的发力点不单是普通用户、开发者,还聚焦在了许多产业领域之中。

这一点,在近期WAVE SUMMIT+ 2022深度学习开发者峰会上百度对它的介绍不谋而合——大模型驱动的产业级搜索系统。

文心百中的特点可以总结为三点:“极简的系统”、“强大的语义理解”和“极低的人力成本”。

大模型产业新进展:百度文心如何革新搜索与应用?

百度CTO、深度学习技术及应用国家工程研究中心主任王海峰还提到:

🌟企业掌握算法、算力与大数据三大核心,可将模型生成的黑科技转化为易于操作的生产力,通过创新的【一站式】生产平台,以低门槛、高速度,向各行各业输送定制化的【超大规模】模型服务。这样一来,一条引领未来的【模型经济】产业链就得以构建。🚀

这也正是百度文心大模型产业化路径的一个缩影,而铺设这么一条路百度已有数载时间。

那么站在现在这个时间节点,大模型的产业之路,或者更广泛的来说是AI的产业化之路,都有啥新进展?

我们不妨一同来看下。

百度的大模型之路:越发亲民、易用

“亲民”、“易用”,是纵观整场WAVE SUMMIT后,对百度大模型最为直观的感受。

这里可以从两个方面来理解。

其中之一便是越发接地气,“文心一格”的能力升级便是很好的体现。

🎨✨百度AI新力作🌟🎨——文心一格,8月闪耀登场!🎉只需轻点键盘,将文字转化为视觉盛宴,这里汇集了无限创意与艺术魅力。🌍无论描绘山水、人物还是抽象概念,都能一键生成独特风格的画作,满足你的创作灵感瞬间爆发!🎨👩‍💻无论是专业艺术家还是日常爱好者,都能在这里找到属于自己的创作乐趣。🌐探索无尽可能,让想象力跃动于每一笔墨之间!🌟

把“凤凰”相关的表述输入进去,再选择相应风格,就能得到下面这张恢弘绚丽的作品:

大模型产业新进展:百度文心如何革新搜索与应用?

而这一次,百度把文心一格变得更加亲民、功能更加丰富。

例如可以“以图生图”,通过用户输入的图,可以生成按用户指定要求风格的一些新图。

大模型产业新进展:百度文心如何革新搜索与应用?

还可以“文字编辑图片”,只需要简单描述下文字,就可以极简地对图片进行编辑。

大模型产业新进展:百度文心如何革新搜索与应用?

不仅如此,还可以让图片一键生成视频

大模型产业新进展:百度文心如何革新搜索与应用?

这便是文心大模型“接地气”产品化的其中一面。

另一面,则是在固有大模型的“根节点”基础上,以“产业级”、“知识增强”为路径,不断向下繁衍出更多“叶节点”——聚焦产业的大模型。

整体而言,这次文心大模型又发布了11个全新大模型:

5个基础大模型1个任务大模型5个行业大模型

大模型产业新进展:百度文心如何革新搜索与应用?

五个新基础大模型

首先是在NLP大模型方面。

这次推出了知识增强轻量级大模型ERNIE 3.0 Tiny,它是以ERNIE 3.0千亿参数大模型为“教师”,通过多任务知识蒸馏手段,将“毕生所学”浓缩到了一个轻量级模型(10亿级、亿级和千万级)

🌟ERNIE 3.0 Tiny的超级亮点在于它的泛化实力强大!相比超大型模型,它以惊人的速度提升,从几十到上百的推理效能飞跃,显著降低了超大模型实际应用中的高昂成本。🚀这不仅意味着高效,更是为AI技术的普及开辟了更便捷的道路。🌍

大模型产业新进展:百度文心如何革新搜索与应用?

跨模态方面,新增了3款大模型。

跨模态理解大模型ERNIE ViL 2.0,采用多视角对比学习方法,同时构建模态内部与模态之间的表示对齐,在中文、英文效果上均超越业界最优模型。

🎉ERNIE-ViL 2.0的大动作!🔍现在已经在飞桨的商业旗舰产品EasyDL中闪耀登场,提供全方位的模型优化和智能推理服务。无论是图片还是文本,都能轻松应对,满足各类🔥图文匹配需求。无需繁琐步骤,一键式操作,让你的工作效率直线上升!💪赶紧体验,开启你的智能化之旅吧!

大模型产业新进展:百度文心如何革新搜索与应用?

跨模态生成大模型ERNIE ViLG 2.0,属于知识增强的混合降噪专家模型。

它的训练过程引入了视觉知识和语言知识,可以提升模型跨模态语义理解能力与可控生成能力。

ERNIEViLG2.0的卓越之处在于它巧妙地融合了专家网络,显著提升了模型的深度与广度,从而实现了降噪扩散的高效优化。这不仅保证了图像生成的高质量,还通过先进的算法增强了细节表现力,让每一张输出都如艺术品般精致。欲了解更多关于如何利用这项技术提升图像处理效能的秘密,欢迎探索我们的专业知识库,那里有更多专业技术解读等你来发现!🎉🔍

大模型产业新进展:百度文心如何革新搜索与应用?

文档智能大模型ERNIE-Layout,它是以文心多语言ERNIE为基础,融合了文本、图像、布局等信息进行跨模态联合建模,还引入了布局知识增强,提出阅读顺序预测、细粒度图文匹配等自监督预训练任务,并最大支持96种语言。

它所擅长且已应用的领域包括金融、保险、能源、物流、医疗等行业。

大模型产业新进展:百度文心如何革新搜索与应用?

最后是在生物计算大模型上,推出了单序列蛋白质结构预测大模型HelixFold-Single,它是业界首个开源的、基于单序列语言模型建模的蛋白质结构预测大模型。

从近3亿的无标注蛋白质数据中提取信息,建模蛋白质之间的关系,从而将MSA同源信息隐式的学习在预训练大模型中,进而有效地替代MSA信息检索模块,使得模型推理速度提升数百倍。

从效果上来看,HelixFold-Single在抗体蛋白结构预测上比AlphaFold2更优,更有助于抗体药物的设计 。

大模型产业新进展:百度文心如何革新搜索与应用?

一个新任务大模型

代码大模型ERNIE-Code,它是在海量代码和文本数据基础上进行预训练,采用多语言多代码联合学习。

由于ERNIE-Code基于中间语言的翻译语言模型,因此它还具备跨多种自然语言和编程语言的语义理解和生成能力。

据了解,ERNIE-Code在代码生成任务、代码搜索任务,多语言代码摘要和代码文档翻译等多个公开的评估基准上取得领先效果。

大模型产业新进展:百度文心如何革新搜索与应用?

5个行业大模型

在此之前,文心行业大模型已经发布过6个,而这次,又有5位成员被涵盖了进来。

大模型产业新进展:百度文心如何革新搜索与应用?

它们分别是:

深燃-百度·文心:知识增强的燃气行业大模型吉利-百度·文心:知识增强的汽车行业大模型泰康-百度·文心:知识增强的保险行业大模型TCL-百度·文心:知识增强的电子制造行业大模型辞海-百度·文心:知识增强的社科行业大模型

……

除此之外,在工具与平台层面上,百度还将大模型的开发套件全面升级,开箱即可用的建模、定制、精调和可信学习工具。

再如飞桨企业版EasyDL零门槛AI开发平台和BML全功能AI开发平台,升级提供全流程开箱即用的大模型能力。

这就是此次百度在大模型上的最新动作,也是大模型应用的最新风向标。

不难看出的一点是,百度的文心大模型产业味道非常浓厚,它的“叶节点”正在向千行百业蔓延开来。

或许对于百度而言,大模型和行业大模型之间的关系,也展现出面向产业开放和赋能的一面。

好比武林至尊把自家的兵工厂、铸剑池,对外开放,帮助需要的任何产业方打造趁手兵器。

如果说文心大模型是百度自家打造的“独门宝剑”,完全是基于自身的武功、特点、需求打造的工具,主要为自己服务。

那么产业大模型,就是百度给产业各方提供了铸剑服务,帮助打造所需的工具,来自产业需求,用于产业痛点,而且产业方完全不需要掌握大模型这样的高门槛技术,借助百度就能完成符合自己需求的大模型。

而如此能力背后,还离不开大模型背后更为底层的一个东西,那便是深度学习平台飞桨。

在这次的WAVE SUMMIT中,飞桨同样也有了较大的升级。

飞桨升级2.4版本,“产业味”更重了

用王海峰的话来说,飞桨这个深度学习平台是基础共性平台,下接芯片,上承应用,相当于智能时代的操作系统。

其在AI技术应用、AI产业化进程中的重要性可见一斑。

而且飞桨作为一个深度学习平台,虽与文心大模型“异曲”,但从出发点和目标来看,却又有着“同工”之妙——加速AI的落地。

为此,时隔半年之后,飞桨已经步入到了2.4版本的阶段。

若是将这次的升级提炼出三个关键词,它们分别是技术、功能和生态。

大模型产业新进展:百度文心如何革新搜索与应用?

首先是在技术方面的“三部曲”:

开发:新增稀疏计算、图学习API;升级高阶自动微分能力,支持科学计算应用;动态图转静态图技术升级,支持复杂模型导出和部署。训练:业界首个同时支持复杂算法+超大图+超大离散模型的大规模图学习训练技术,单机即可支持百亿节点、数百亿边的采样和训练,并可通过多机扩展支持更大规模部署:高扩展、自动化、高性能推理技术助力大模型应用;新发布AI部署工具FastDeploy。

这是在技术层面上的能力提升,也是飞桨每年在WAVE SUMMIT上必秀的一块肌肉。

其次是在功能体验方面,可以说是“产业味”越发浓郁。

例如飞桨这次发布了业界首个一站式开源大模型开发套件PaddleFleetX,可以全流程支撑大模型生产落地。

大模型产业新进展:百度文心如何革新搜索与应用?

不仅如此,从百度透露出来的几组数据,也能够体现飞桨越发浓重的产业味:

产业级模型库开源低代码模型新增至600+个产业级特色PP系列模型新增至42个发布飞桨产业级模型库一站式入口产业实践范例即产业落地全流程“样板间”新增至68个,覆盖金融、工业、交通、互联网等重点行业。

最后是生态建设方面,可以分为三个方面。

在产业生态上,飞桨已经联合了行业众多龙头企业,包括国家能源集团、中国工商银行、中国联通、中国石油、中国铁道科学研究院、中国移动、中国一汽,发布产业范例征集计划。

在硬件生态上,飞桨硬件生态共创计划”硬件伙伴由13家增至28家。

其中12家(包括英伟达、英特尔、昆仑芯、Arm、天数智芯、清微智能等)已经发布飞桨生态发行版,为开发者提供软硬一体化体验。

在人才生态上,“飞桨AIStudio人工智能学习与实训社区”新增了“企业实训”与“生态异构算力中心”。

二者同样是已经与国家电网、OPPO、英特尔、英伟达和曙光等龙头企业展开了合作。

……

由此可见,无论是大模型亦或是飞桨,它们现在所聚焦的内容无不在围绕着“产业”二字在展开。

那么接下来,就要回到最初我们提到的那个问题:

AI产业化之路,现在什么阶段了?

要回答这个问题,我们不妨先将四年来的Wave Summit铺开来看下。

在2019年第一届峰会中,王海峰就提到:

深度学习正在推动人工智能进入工业大生产阶段。

王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。

这种模式可以归结为“三化”,即标准化、自动化和规模化,这也就意味着人工智能在进入工业大生产阶段。

到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。

这也就迈出了通过预训练大模型来降低AI门槛的重要一步。

而在去年,百度集团副总裁吴甜在峰会中提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。

并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。

与此同时,在同年的12月份,文心大模型也随之正式亮相。

就在今年5月的峰会中,吴甜还提到“今年是大模型产业落地的关键年”,并给出了她认为的一种解法:

要做好落地,需要解决的关键问题是,前沿的大模型技术如何与真实场景的方方面面要求相匹配。

而到了今天这个时间节点,在AI产业化这条道路上,百度正在发出一个非常明显的信号——

框架、模型不仅要用起来,更重要是要打出去,用吴甜的话来说就是“生态太重要了”

对于这一点其实并不难理解,正如历史中每一次的工业大革命,都是有通用技术的普及一样,例如机械技术、电气技术和信息技术。

而要做人工智能时代下的普及,就需要先让框架、大模型在企业,尤其是龙头企业铺展开来;而后通过反馈和优化,逐层向下更深入的应用起来。

这或许也是百度不遗余力降低AI技术使用门槛,并且把自家“最强兵工厂”对外营业,与产业众多企业强强联手的原因了。

那么在如此发力之下,AI产业化又走到了什么阶段?

或许借鉴更为大众所熟悉的移动通信发展史,可以更好得出结论。我们知道,智能手机之前,有过最初的大哥大、小灵通、功能机,最后才是我们所处的智能手机时代。

有人认为即将来到功能机,也有人认为一切才刚开始。

换个角度来说,历史性的一页才刚刚拉开序幕,广阔的产业化机遇才刚刚开始。就像瓦特完成蒸汽机改良时,没有人能意识到,会进入一个生产力大爆炸的新时代。

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

大模型产业新进展:百度文心如何革新搜索与应用?

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

版权声明:lida 发表于 2023年3月23日 pm2:46。
转载请注明:大模型产业新进展:百度文心如何革新搜索与应用? | ChatGPT资源导航

相关文章