文章主题:
类ChatGPT应用为何在2023年的春天“竞相开放”?“文心一言”可否成为百度的新技术引擎呢?
文|王倩
ID | BMR2004
来源 |《商学院》杂志4月刊
千呼万唤始出来!
🌟2023年度科技巨头震撼登场!🎉百度CEO李彦宏携手创新之作”文心一言”,引发热议!🔍然而,这次亮相并未如预期那般惊艳,让不少粉丝略感落空。虽然”文心一言”备受期待,但市场反应似乎有些平淡。🤔这款由百度倾力打造的AI语言模型,旨在打破传统,引领潮流,却在初次公开时未能立即掀起热潮。尽管技术实力雄厚,但用户对于新产品的接受度和喜爱程度还需时间验证。🌈尽管如此,李彦宏的行业影响力不容忽视,他的每一次创新尝试都可能成为业界的新风向标。未来,”文心一言”能否凭借其独特魅力,扭转乾坤,我们拭目以待。💪SEO优化提示:#百度#李彦宏#文心一言#AI语言模型#市场反应#创新期待
🌟改写版:🎉无现场展示的录播互动,两位高管虽略有不畅,却以专业魅力点燃了期待。他们的言论本应是文心一言的闪耀瞬间,如今却平添了一份别样的深度与吸引力。✨原本的高光时刻,似乎在微妙的互动中,增添了一丝不确定性和神秘感,让人不禁对接下来的内容产生更强烈的探索欲。📚这份不完美,反而可能成为吸引眼球的独特卖点。💼
🌟【动态追踪】百度股价午后波动,文心一言备受关注!🚀在万众瞩目的时刻,百度集团的股票于昨日午后迎来显著起伏,一度跌至9%以上,这场股价的戏剧性变化无疑引发了市场的广泛关注。🔥伴随着百度文心一言的发布前夕,ChatGPT的第四代升级消息犹如一颗重磅炸弹,瞬间点燃了AI领域的热度。💥备受瞩目的百度“新宠”——文心一言,此刻正以ChatGPT为参照,成为行业热议焦点。两者间的对比引发业界深度探讨,技术实力与市场潜力成为评判的关键指标。🔍同时,Google的Bard也加入了这场创新竞赛,巨头们的较量无疑将AI领域推向新的高潮。💪尽管外界对这些AI产品的未来表现充满期待,但投资者和用户更关心的是,谁能在这场创新风暴中脱颖而出,引领行业趋势。🌈SEO优化提示:百度文心一言、ChatGPT、股价波动、AI竞赛、市场潜力、技术实力
类ChatGPT应用,为何在2023年的春天“竞相开放”?“文心一言”可否成为百度新技术引擎呢?
01
诞生
🌟🔥2022年度人工智能焦点🔥🌟:生成式AI引领潮流!🚀在这个瞬息万变的信息时代,每季度都能见证AI领域的创新风暴。今年,一个耀眼的新星横空出世——生成式AI,以其强大的创造力和无限可能,迅速抢占了科技舞台的中心位置。从ChatGPT到Google的Bard,再到文心一言,这些引领潮流的名字背后,隐藏的是能够基于已有素材生成全新内容的先进技术。🌍🎨生成式AI,就像一位多才多艺的艺术家,只需一点灵感,就能创作出令人惊艳的作品——无论是流畅的对话,还是创新的诗歌,甚至是细致入微的图像描述。它打破了传统界限,让想象力无处不在。💻🎶🖼️SEO优化提示:使用关键词“生成式AI”、“创新风暴”、“ChatGPT”、“Google Bard”、“文心一言”、“内容创作”和“艺术性”。记得保持语言自然流畅,适当融入行业术语,同时确保信息准确且有价值。
文心一言是百度研发的对标 ChatGPT的大语言模型、生成式AI产品。
🎉【智能新篇】🔥百度文心一言,引领未来语言风暴!🌟在震撼人心的发布会上,李彦宏展示了这款创新神器——文心一言的强大实力,它不仅具备了文学创作的才情,还能轻松驾驭商业文案的撰写,用精准的数理逻辑点亮思考之光。💡中文理解的深度,让每一个字符都跃动着智慧的火花,而多模态生成的能力,则将创意无限放大,无论是图文并茂还是音频视频,都能信手拈来,展现无尽可能。🎨无需担心版权或联系方式,文心一言以技术驱动内容,致力于为用户提供最优质、最贴近需求的服务。🚀让科技赋能你的创作,拥抱未来,就从掌握文心一言开始!🌍#百度文心# #智能写作# #未来语言革命
🌟🚀李彦宏揭秘大模型训练背后的“三驾马车”:大数据、大算力与超大规模模型!每轮训练都是技术与资金的双重考验,耗资之巨不言而喻。据国盛证券深度研究《ChatGPT的算力挑战》揭示,训练GPT-3的成本犹如天文数字,高达140万美元,而更大规模的LLM(语言巨轮)更是花费不菲,区间在200至1200万!🚀🔍这些巨额投资只为打造未来智能的核心力量,引领技术革新潮流。
这种耗资巨大的投入,并非每一个企业都能支撑得起。财报显示,2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。
同时,这种超大规模模型的训练和推理,给深度学习框架带来了很大考验。除了资金,还需要有强大的算力支持。为了支持千亿参数模型的高效分布式训练,百度的AI深度学习框架——百度飞桨(PaddlePaddle),专门研发了 4D 混合并行技术。
文心一言并非“横空出世”,早在2019 年,百度就推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求。根据其最新发布的ERNIE 3.0 Zeus(任务知识增强),已经拥有千亿级参数,并具备智能创作等各类自然语言理解和生成任务。
百度是为数不多的进行全栈布局的人工智能公司。所谓全栈布局,是指AI深入到从设计到最终实现的每个环节,包括底层芯片的IP和芯片产品、计算架构、API等。
人类进入人工智能时代,IT技术的技术栈发生了根本性变化。过去技术栈基本分为三层:芯片层、操作系统层和应用层;现在可以分为四层:芯片层、框架层、模型层和应用层。文心一言位于模型层。
“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。这是百度发布会现场,文心一言即兴作的一首“藏头诗”,不仅如此,它还能准确讲出“洛阳纸贵 ”这一成语典故以及对应的经济学原理。不得不说,文心一言在中文语言和中国文化上的表现,令人满意。
从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未发展到完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
02
布局AI
百度为国内生成式AI开了一个头。
北京大学新闻与传播学院教授胡泳认为,人工智能是科技领域的一个大事件,影响深远。不仅涉及到产业和企业,还会影响到整个社会和文化。“从战略角度讲,中国互联网厂商肯定要进入,否则意味着我们将在关键技术的跨越阶段错失很大的机会。”胡泳表示。
过去十年,移动互联网的发展改变了国内的互联网格局。尤其是在BAT三阵营的争夺中,单从股价来看百度已经掉队多年,尤其在火热的电商潮流中,百度很明显地败下阵来,这也让人工智能这条主赛道成为百度的必争之地。
实际上,早在2010年百度就成立了专门的业务部门——自然语言处理部,迈出了初探AI的第一步,并由此成为了中国最早深度布局AI的企业。2013年初百度深度学习研究院正式成立。2016年,百度推出人工智能产品百度医疗大脑。2017年,李彦宏搭乘基于apollo技术的自动驾驶汽车,经北京五环路去参加发布会,引发轰动。也就是在这场发布会上,百度宣布调整战略为All in AI。
李彦宏认为,生成式AI将催生新产品、新业态,会有很多创业和投资机会。百度首席技术官王海峰表示,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括监督精调、从人类反馈中进行强化学习(RLHF)、提示构建、知识增强、检索增强和对话增强。
值得注意的是,监督精调是百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来进行模型训练;提示构建则是对词语序列的概率分布进行建模,利用上下文信息预测后续词语出现的概率分布,从而同时使用RLHF,将人类偏好作为奖励信号并微调模型,实现有逻辑的对话能力。
03
商业化
文心一言发布当日,百度股价大跌,但峰回路转,次日(3月17日),百度的股价大涨,收盘涨幅超13%。百度方面表示,已经有650家企业与百度的文心一言达成合作。
李彦宏表示:“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”
胡泳认为,百度在这场AI之战中有属于自己的机会。一方面,百度本身是技术出身,且核心是中文搜索,原本就拥有数10亿的搜索数据和图片数据,这些数据和图片构成了百度的知识图谱,这是它的先天条件。
在胡泳看来,AI人工智能的竞争,核心是算法、算力和数据的综合竞争,数据是扼守这场竞争的重要一环,百度对中文语言的处理处于独一无二的位置,这些都属于百度的先天优势。
另一方面,百度不仅要做面向消费者层级的产品,还要做面向企业的或者面向产业的产品。百度将文心一言定义为自主研发的产业级知识增强大模型,这并非简单的模型,而是意味着百度有实力在行业大模型上有工具、有平台,能够支撑企业和开发者进行高效便捷的应用开发。
有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。很多人的工作性质会发生不可逆转的改变,而且不少人也在担心这一趋势的到来。
在胡泳看来,现阶段人工智能与人类有可能是一种互补关系。虽然在内容市场中难以避免机器人的进入,但是机器人的投入使用并不是为了替代人类写作,有时候可能是担任人类创作者的助理,在某种程度上可以减少内容市场中的人力投入,而在某些场景内,人工智能的写作工具比人类作家有能力在更短的时间里创造更多内容。
根据李彦宏的预测,文心一言将会打开三大产业的机会大门。
第一类是新型云计算公司,文心一言将根本性地改变云计算行业的游戏规则,其主流商业模式将从IaaS变为MaaS。之前企业选择云厂商更多看算力、存储等基础云服务。未来,企业更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层技术栈之间的协同。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,它们具有行业专有技术,调用通用大模型能力,为行业客户提供解决方案。简单来说,预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现不同行业、垂直场景的布局。比如百度文心大模型,已经在电力、金融、媒体等领域发布了10多个行业大模型。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。
但让胡泳担心的是,技术的飞速发展正突显法律的滞后。他呼吁,能否预先将法律框架建立起来,建立相应的规则,让人工智能的发展进入一个良性轨道。
04
较量
尽管人们对文心一言“千呼万唤”,但其亮相不免让业界有些失望:录制Demo无现场演示,业界争议纷纷,在资本市场,百度股票更是出现大跌。
互联网分析师丁道师认为,原因在于百度文心一言发布前一天,OpenAI的GPT-4发布,而GPT-4的表现力远超这个时代所有同类型产品。
ChatGPT-4提前登场,文心一言不可避免地会被拿来做比较。李彦宏既强调百度的客户及百度本身对文心一言的庞大需求,也不断放低身段,承认百度“没有完全Ready”,这也意味着百度要对标ChatGPT甚至是GPT-4,门槛依然很高。
在胡泳看来,百度真正的考验刚刚到来,虽然百度早就将主赛道调整到人工智能上,如今人工智能领域也已然迎来机会,但在业内燃起熊熊的战火背景下,如果百度尚未有相关产品,那么在人工智能领域的较量可能就会落在下风。
然而,文心一言与ChatGPT的对比是不可避免的。在文心一言发布后,不少测试者便对二者进行了比较。丁道师认为,ChatGPT的回答相对来说更简洁一些,百度的文心一言回答更丰富一些;文心一言对中文的理解,在一些特定的中文语言环境之下,表现要比ChatGPT要好一些;由于百度文心一言是中国企业研发的产品,要符合中国的法律法规和监管政策,很多敏感问题无法给出答案。相对来说,ChatGPT回答一些敏感问题时,尺度要更大一些。
丁道师认为,需要客观承认,文心一言是一款新的产品,和GPT-4这样的“前辈”相比,差距较为明显。
但他同时表示,如果仅仅在中国市场使用这种生成式的语言模型,随着时间的推移,比如说一年后、两年后,相信文心一言的表现要好于ChatGPT。反之如果在全球范围内使用的话,短期内还是ChatGPT比百度要好一些。
胡泳也认为,百度可能会占有另外一个优势,当它面对中国市场的时候,因为中国的产业和企业有它的独特性,那么它显然会比国外的公司更熟悉中国企业的应用。
本文来源《商学院》杂志2023年4月刊
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!