百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

百度“文心一言”发布,能追上ChatGPT吗?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

深燃(shenrancaijing)原创

作者 | 王敏

编辑 | 金玙璠

“冲刺”一个多月后,百度文心一言终于来了,但刚出道就遭到群嘲。

🎉【揭秘】百度文心一言发布会:不凡背后的小秘密🔍🚀3月16日下午,这场备受瞩目的百度盛宴,虽未如预期般展示出令人惊艳的产品演示,却以独特的方式揭示了其深思熟虑的策略。🔥🚫没有炫酷的现场秀,取而代之的是严谨的“Demo演示”,百度用精心准备的问题和答案,向我们展示了技术实力的点滴。🤔👀外界的吐槽声中,或许隐藏着对谷歌Bard事件的深刻反思。💡百度显然吸取了教训,避免重蹈覆辙,以稳健的步伐前行。💰🔥这场发布会虽无产品直接亮相,却透露出对未来布局的坚定信念和对技术创新的执着追求。🚀SEO优化提示:#百度文心# #Demo演示# #技术实力# #市场谨慎

🎉🚀新产品的热浪正在席卷而来,但往往却被一个神秘的门槛——”邀请码”挡住了去路,让不少满怀期待的用户望而却步。🌟深夜,才是少数幸运儿得以一窥究竟,亲自”试水”的机会。🔥虽然等待可能有些煎熬,但这正是新品魅力的独特之处,激发着用户的探索欲望和对未知的好奇。🌈

🌟深燃体验文心一言五大功能,总体来说,这款产品的智能回复相当流畅,文案质量达到了可立即使用的程度。然而,在面对一些基础问题时,它似乎在理解上稍有不足,难以精准把握提问的意图。更值得一提的是,其多轮对话的成熟度还有待提高。虽然如此,文心一言展现出的潜力不容小觑,对于那些寻求简洁、自然语言交互解决方案的用户来说,它无疑是一个值得探索的工具。SEO优化提示:#文心一言#智能问答#基础问题解析

🎉🔥最新科技动态!昨日全球热议OpenAI震撼发布的=GPT-4超级更新!🔍相较于前辈,它在精度与问题解决能力上更上一层楼,能吞吐超2.5万字的文本巨著,简直如诗如画!🎨虽图像输入功能尚未全面启用,但这股创新风暴已让期待升级!🚀未来已来,这款里程碑式产品无疑将重塑用户对技术的想象。欲了解更多?敬请关注!🌍SEO优化提示:GPT-4, OpenAI, AI更新, 图像处理, 产品标准提升

🎉微软之夜再掀高潮!Microsoft 365 Copilot震撼发布,引领办公新风尚!💡通过将GPT-4技术巧妙融入Office应用,无论是论文撰写到Excel数据分析,Copilot都能提供超凡协助,让繁琐任务瞬间变得轻松高效。🚀这一创新工具不仅被誉为职场革命的催化剂,更是打工人们工作方式的大变革者。🌟欲感受未来办公的便捷,就来体验Copilot吧!别忘了,你的智慧,Copilot帮你加速!🌐 #Microsoft365Copilot #OfficeRevolution #Work smarter, not harder

🌟自从去年底ChatGPT引领技术风暴以来,全球各大科技巨头纷纷加速研发,意图在人工智能领域一较高下。国内的领军者之一,百度也加入了这场激烈的追赶战,备受瞩目。然而,当文心一言甫一亮相,部分用户却遭遇了意外的冷遇感,仿佛被泼了一盆冷水。投资者的情绪同样受到影响,发布会期间,百度股价应声下跌,幅度达到10%。🌟尽管如此,截至3月16日的收盘数据,百度市值依然坚挺,报125.1港元,虽有6.36%的跌幅,但其抗压能力不容小觑。🚀

不可否认,作为国内第一款对标ChatGPT的产品,百度也算是勇敢的迈出了第一步。但此前百度铺天盖地的宣传已经拉高了外界预期,目前看来文心一言有些高开低走,让外界对其何去何从产生了质疑。

亲测百度文心一言,不够AI

从2月初官宣要集中“冲刺”,百度文心一言吊足了外界的胃口。

但在正式发布时,观众们的评价都是“文心一言,一言难尽”、“CheatGPT”等不太正面的言辞。

对于这次百度文心一言和ChatGPT的PK,英诺天使基金合伙人王晟对深燃形容道,就像是“China PPT VS ChatGPT”。

百度“文心一言”究竟怎么样?在发布会现场,百度创始人李彦宏从文学创作、商业文案创作、数理推算、中文理解和多模态生成五个方面举例展示了文心一言的能力。拿到邀请码后,深燃也从五大层面对文心一言进行了体验,并将部分答案与接入GPT-4的微软New Bing或基于GPT-3.5的ChatGPT进行了对比,试图得到一些结论。

在文学创作层面,在对于最近爆火电视剧《黑暗荣耀》的剧情总结时,文心一言的答案和剧情不太相符,New Bing的答案更贴近剧情。不过,在深燃提出将电视剧进行喜剧改编时,两个产品的表现都不算太好,但New Bing对于追问的回答,更加灵活。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / 文心一言

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / New Bing

在商业文案的创作能力上,我们让这两个产品分别给“文心一言”想一句广告词,文心一言设计的广告词词句更加优美,而New Bing设计的广告词更侧重于产品特性。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / 文心一言

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / New Bing

至于数学推理能力,对于小学奥数题的解答,文心一言给出了一个错误答案,New Bing的最终答案是准确的。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / 文心一言

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / New Bing

对于中文理解能力,让两款产品解读网友对于文心一言邀请码的调侃,结果是,文心一言和New Bing都没能精准解读其中的调侃意味,不过文心一言识别出了KFC是快餐品牌,还提醒不要将该邀请码和特定品牌关联。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源/文心一言

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / New Bing

在脑筋急转弯式的对话中,交给文心一言“要电话号码”的任务后,其在第二轮就忘记了,而ChatGPT还记得上一轮的隐藏任务。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / 文心一言

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / ChatGPT

在多模态生成方面,目前ChatGPT的识图功能还没对外开放。文心一言可以根据文字生成图片、语言和视频,但是这并非新功能,此前在百度的其他产品中也已经看到过。而且文字生成图片有时生成的图片并不精准。比如,本意是想获得一只阿拉斯加犬图片,但由于表述不够精确,最后得到的是一张动漫图片。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

图源 / 文心一言

总结下来,从深燃的初步体验来看,“文心一言”没有达到惊艳效果,有时更像搜索引擎,回答问题的方式相对模式化,情感色彩流露较少,在回答问题的精准性、灵活性、上下文多轮对话等方面还有待提升。而基于GPT大模型的产品在语言组织和创造能力上更加灵活、流畅,交互性更强一些。

智能客服从业者Allen对深燃表示,仅从个人体验的主观感受而言,如果说ChatGPT能够提供正确答案的比例在90%,那么文心一言只有70%。不过,至少从用户体验的便捷度而言,文心一言之于国内用户,要比ChatGPT更加方便。

距离OpenAI,百度差了多少步?

对于“文心一言”的产品表现,百度创始人李彦宏略显底气不足,在发布会刚出场不久,就开始主动降低用户预期。他说道,“要对标ChatGPT、甚至GPT-4,门槛还是很高的”、“自己测试还是感觉有很多不完美的地方”。

产品的背后,国内大厂和OpenAI相比,差在了哪里,差距又有多大?

AI大模型之争最早是在国外科技巨头之间,此后国内大厂纷纷跟进。有专家分析称,在2020年中GPT-3发布后,双方差距进一步拉大,当时很多人认为不仅是技术的差距,更体现了AI模型的发展新理念。

在GPT-3的基础上,OpenAI进行了大量的微调和训练,增强交互性、更加产品化后,有了基于3.5版本的ChatGPT。

值得注意的是,3月14日GPT-4的发布,再次拉大了双方的距离。和上一代相比,GPT-4有很多跨越式提升,包括逻辑推理能力更强,比做题家更会考试;支持图像输入并能理解图像;能接收超大上下文,支持输入处理超过25000个单词的文本;更有创造力,能够写代码、写小说、编剧。

差距拉大的背后,是人才、资金投入和技术积累的差距。

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

来源 / 视觉中国

伴随着ChatGPT的火热,从业者们都表示,要做底层AI大模型,资金、顶尖科技人才、技术积累,这些要素缺一不可。

做大模型,前提是有资金的投入。OpenAI在2019年获得微软10亿美金的投入后,又于今年获得了微软100亿美金的投资,这让其有了烧钱的资本。业界测算,GPT-3涉及1750亿参数,训练费用约花费1200万美元。据国盛证券报告估算,GPT-3训练一次成本约为140万美元,每一次训练任务都耗资巨大。

此外,大模型训练的三要素包括大算力、大数据和大模型。有从业者指出,影响最后训练结果的因素有很多,包括清洗、标注、模型结构设计、训练推理的技术积累等。每一个因素的变化都影响着最后的结果。

过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。

但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。

王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。

AI,百度不能输的一战

相较于完美,文心一言更加注重“争第一”,李彦宏强调,“对标ChatGPT,百度是全球大厂中第一个”。

大模型带来了AI产业的变革,也将是未来十年的主流趋势,这已经成为了业界共识。

想要入场分羹的选手不少。自去年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。

在国内一级市场上,投资机构为了投大模型公司,焦虑难安,行业几乎每天都会有大量认知的迭代。与之相应的是创业热潮,前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬,都在杀向大模型赛道。

国内大厂们更是如此。除了百度之外,阿里、腾讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。

相较于其余互联网大厂而言,AI,是百度“不能输”的一战。王晟分析道,站在企业角度,腾讯、阿里等大厂,发力AI是给原有业务提供助力,但AI之于百度是生死问题,需要“殊死一搏”,也会用出“破釜沉舟”的力气来研发新产品。

来源 / 视觉中国

在百度的营收结构中,广告是大头,2022年占六成左右,但近几年,呈现萎缩局势,而且被阿里、腾讯等大厂超越。百度需要搜索引擎的变革来使得广告业务回温。另一方面,百度近几年在AI方面投入颇多,而且一直对外强调其AI能力,更是将以AI为特色的百度智能云当作重要增长曲线。

OpenAI在GPT-4发布后,通过ChatGPT Plus付费版以及面向企业开放接口,正从一家小型非营利性实验室向一家成熟的商业公司转变。Allen认为,百度作为互联网大厂,自身体量比较大,有很多业务线可以直接用上文心一言,享受商业化的红利。

此外,AI大模型时代的到来,也将带来大量产业机会。李彦宏在发布会上称,大语言模型带来三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow(技术诀窍),调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。

尽管“文心一言”和ChatGPT相比或许还有差距,但并不意味着其没有发展空间。

一方面,能够发布一款成型产品,百度在国内争夺的第一,确实领先了其他同行。另一方面,在国内用户和企业较难顺畅使用ChatGPT的情况下,需要一款本土产品来提供服务。“技不如人”的情况下,百度还可以靠本土化取胜。李彦宏也提到,百度在没有完全准备好的情况下发布“文心一言”,是出于市场的需要。

考虑到信息安全和数据安全等因素,中国必须要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技术门槛,目前中国能做语言类大模型的团队非常有限,有潜在能力做的只有10来个团队,最终能成的可能只有2-3家。

也就是说,百度或许并不需要和ChatGPT正面硬刚,只要在国内市场上能够占据领先位置,就能够享受中国市场所带来的红利和发展空间。

王晟认为,短期内,百度的“文心一言”或许没有达到市场预期,但从中长期来看,百度还是具备一定的竞争力。

新一轮AI范式变革,才刚刚开始。

*题图来源于视觉中国。返回搜狐,查看更多

责任编辑:

百度‘文心一言’发布,能否追赶ChatGPT?实测后的五大能力对比,是挑战还是凉水?

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

相关文章