百度文心一言首秀遇冷,是否只是AI入门的热身?”
文章主题:
深燃(shenrancaijing)原创
作者 | 王敏
编辑 | 金玙璠
“冲刺”一个多月后,百度文心一言终于来了,但刚出道就遭到群嘲。
🎉【揭秘】百度文心一言发布会:Demo背后的价值与反思🚀于3月16日下午的这场备受瞩目的活动中,百度文心一言虽未如预期般带来产品现场的惊艳展示,却以独特的方式揭示了其深藏不露的技术实力。没有直接的产品演示,而是巧妙地通过“Demo演示”,展示了其在问题和答案处理上的卓越能力,尽管这一举动引发了部分用户的质疑声浪,但也折射出百度对产品质量的严谨态度。谷歌Bard事件的前车之鉴,无疑让百度更加谨慎,避免重蹈覆辙。这场发布会更像是百度的一次深思熟虑的战略调整,旨在以稳健的步伐推进技术的研发和市场接受度。尽管没有直接的产品展示,但这种低调务实的做法或许更能赢得用户和市场的信任。SEO优化提示:#百度文心一言# #Demo演示# #技术实力# #市场策略# #谷歌Bard教训
🌟对于热切期待新产品的小伙伴们来说,”邀请码”无疑是一道难以逾越的门槛。晚上,这扇神秘之门才微微开启,让少数幸运儿得以一探究竟,品尝那份特别的滋味。 若要让更多人尽早触及,不妨尝试调整策略,让新品体验不再那么稀缺,让每个跃动的心都能找到属于自己的入口。🌈
🌟深燃体验文心一言五大功能,总体来说,这款产品的回答表现相当不错,语言流畅,接近可用级别。然而,在处理一些基础问题时,它似乎在理解上稍有挑战,难以给出精准的答案。 Além disso, its multi-turn dialogue capabilities are not yet fully developed. Despite these imperfections, the potential of this AI language model is evident. Keep an eye on it for further improvements! 🚀
🎉🔥最新科技动态!昨日全球热议OpenAI震撼发布的=GPT-4超级更新!🔍相较于前辈,它在精度与问题解决能力上更上一层楼,能吞吐超2.5万字的文本巨著,简直如诗如画般流畅!🎨虽图像输入功能尚未全面启用,但这股创新洪流已让期待升级的用户翘首以盼。这款里程碑式产品不仅刷新了用户体验,也让行业标准得以革新。欲了解更多?敬请关注未来的科技浪潮!🔥🎉
🎉微软之夜再掀高潮!Microsoft 365 Copilot震撼发布,引领办公新风尚!💡通过将GPT-4技术巧妙融入Office应用,无论是论文撰写到Excel数据分析,Copilot都能提供超凡助力,让繁琐任务瞬间变得轻松高效。🚀这一创新工具不仅被誉为职场革命者,正逐步颠覆传统打工人的工作模式,让你的工作效率直线上升!🌟欲感受未来办公的便捷,赶紧体验Microsoft 365 Copilot吧!✨#Office新助手 #Copilot革命 #工作效率提升
🌟自从去年底ChatGPT引领技术风暴以来,全球各大科技巨头纷纷加速研发,力求在人工智能领域取得突破。国内的领军企业百度也不甘示弱,成为备受关注的竞品之一。然而,当文心一言甫一亮相,部分用户却遭遇了意外的冷遇感,仿佛被泼了一盆冷水。📊投资者对百度的市场反应同样微妙,发布会期间,其股价不争气地跌宕起伏,一度下跌10%,这无疑给期待满满的投资者们浇了一盆凉水。🚀截至3月16日收盘时,百度的股价以125.1港元的价格波动,当日跌幅达到6.36%,反映出市场对其新产品的复杂情绪。📊尽管面临挑战,百度仍需保持冷静,利用好自身的技术优势和用户基础,毕竟追赶的步伐才刚刚开始。🏆
不可否认,作为国内第一款对标ChatGPT的产品,百度也算是勇敢的迈出了第一步。但此前百度铺天盖地的宣传已经拉高了外界预期,目前看来文心一言有些高开低走,让外界对其何去何从产生了质疑。
亲测百度文心一言,不够AI
从2月初官宣要集中“冲刺”,百度文心一言吊足了外界的胃口。
但在正式发布时,观众们的评价都是“文心一言,一言难尽”、“CheatGPT”等不太正面的言辞。
对于这次百度文心一言和ChatGPT的PK,英诺天使基金合伙人王晟对深燃形容道,就像是“China PPT VS ChatGPT”。
百度“文心一言”究竟怎么样?在发布会现场,百度创始人李彦宏从文学创作、商业文案创作、数理推算、中文理解和多模态生成五个方面举例展示了文心一言的能力。拿到邀请码后,深燃也从五大层面对文心一言进行了体验,并将部分答案与接入GPT-4的微软New Bing或基于GPT-3.5的ChatGPT进行了对比,试图得到一些结论。
在文学创作层面,在对于最近爆火电视剧《黑暗荣耀》的剧情总结时,文心一言的答案和剧情不太相符,New Bing的答案更贴近剧情。不过,在深燃提出将电视剧进行喜剧改编时,两个产品的表现都不算太好,但New Bing对于追问的回答,更加灵活。
图源 / 文心一言
图源 / New Bing
在商业文案的创作能力上,我们让这两个产品分别给“文心一言”想一句广告词,文心一言设计的广告词词句更加优美,而New Bing设计的广告词更侧重于产品特性。
图源 / 文心一言
图源 / New Bing
至于数学推理能力,对于小学奥数题的解答,文心一言给出了一个错误答案,New Bing的最终答案是准确的。
图源 / 文心一言
图源 / New Bing
对于中文理解能力,让两款产品解读网友对于文心一言邀请码的调侃,结果是,文心一言和New Bing都没能精准解读其中的调侃意味,不过文心一言识别出了KFC是快餐品牌,还提醒不要将该邀请码和特定品牌关联。
图源/文心一言
图源 / New Bing
在脑筋急转弯式的对话中,交给文心一言“要电话号码”的任务后,其在第二轮就忘记了,而ChatGPT还记得上一轮的隐藏任务。
图源 / 文心一言
图源 / ChatGPT
在多模态生成方面,目前ChatGPT的识图功能还没对外开放。文心一言可以根据文字生成图片、语言和视频,但是这并非新功能,此前在百度的其他产品中也已经看到过。而且文字生成图片有时生成的图片并不精准。比如,本意是想获得一只阿拉斯加犬图片,但由于表述不够精确,最后得到的是一张动漫图片。
图源 / 文心一言
总结下来,从深燃的初步体验来看,“文心一言”没有达到惊艳效果,有时更像搜索引擎,回答问题的方式相对模式化,情感色彩流露较少,在回答问题的精准性、灵活性、上下文多轮对话等方面还有待提升。而基于GPT大模型的产品在语言组织和创造能力上更加灵活、流畅,交互性更强一些。
智能客服从业者Allen对深燃表示,仅从个人体验的主观感受而言,如果说ChatGPT能够提供正确答案的比例在90%,那么文心一言只有70%。不过,至少从用户体验的便捷度而言,文心一言之于国内用户,要比ChatGPT更加方便。
距离OpenAI,百度差了多少步?
对于“文心一言”的产品表现,百度创始人李彦宏略显底气不足,在发布会刚出场不久,就开始主动降低用户预期。他说道,“要对标ChatGPT、甚至GPT-4,门槛还是很高的”、“自己测试还是感觉有很多不完美的地方”。
产品的背后,国内大厂和OpenAI相比,差在了哪里,差距又有多大?
AI大模型之争最早是在国外科技巨头之间,此后国内大厂纷纷跟进。有专家分析称,在2020年中GPT-3发布后,双方差距进一步拉大,当时很多人认为不仅是技术的差距,更体现了AI模型的发展新理念。
在GPT-3的基础上,OpenAI进行了大量的微调和训练,增强交互性、更加产品化后,有了基于3.5版本的ChatGPT。
值得注意的是,3月14日GPT-4的发布,再次拉大了双方的距离。和上一代相比,GPT-4有很多跨越式提升,包括逻辑推理能力更强,比做题家更会考试;支持图像输入并能理解图像;能接收超大上下文,支持输入处理超过25000个单词的文本;更有创造力,能够写代码、写小说、编剧。
差距拉大的背后,是人才、资金投入和技术积累的差距。
来源 / 视觉中国
伴随着ChatGPT的火热,从业者们都表示,要做底层AI大模型,资金、顶尖科技人才、技术积累,这些要素缺一不可。
做大模型,前提是有资金的投入。OpenAI在2019年获得微软10亿美金的投入后,又于今年获得了微软100亿美金的投资,这让其有了烧钱的资本。业界测算,GPT-3涉及1750亿参数,训练费用约花费1200万美元。据国盛证券报告估算,GPT-3训练一次成本约为140万美元,每一次训练任务都耗资巨大。
此外,大模型训练的三要素包括大算力、大数据和大模型。有从业者指出,影响最后训练结果的因素有很多,包括清洗、标注、模型结构设计、训练推理的技术积累等。每一个因素的变化都影响着最后的结果。
过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。
但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。
王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。
AI,百度不能输的一战
相较于完美,文心一言更加注重“争第一”,李彦宏强调,“对标ChatGPT,百度是全球大厂中第一个”。
大模型带来了AI产业的变革,也将是未来十年的主流趋势,这已经成为了业界共识。
想要入场分羹的选手不少。自去年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。
在国内一级市场上,投资机构为了投大模型公司,焦虑难安,行业几乎每天都会有大量认知的迭代。与之相应的是创业热潮,前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬,都在杀向大模型赛道。
国内大厂们更是如此。除了百度之外,阿里、腾讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。
相较于其余互联网大厂而言,AI,是百度“不能输”的一战。王晟分析道,站在企业角度,腾讯、阿里等大厂,发力AI是给原有业务提供助力,但AI之于百度是生死问题,需要“殊死一搏”,也会用出“破釜沉舟”的力气来研发新产品。
来源 / 视觉中国
在百度的营收结构中,广告是大头,2022年占六成左右,但近几年,呈现萎缩局势,而且被阿里、腾讯等大厂超越。百度需要搜索引擎的变革来使得广告业务回温。另一方面,百度近几年在AI方面投入颇多,而且一直对外强调其AI能力,更是将以AI为特色的百度智能云当作重要增长曲线。
OpenAI在GPT-4发布后,通过ChatGPT Plus付费版以及面向企业开放接口,正从一家小型非营利性实验室向一家成熟的商业公司转变。Allen认为,百度作为互联网大厂,自身体量比较大,有很多业务线可以直接用上文心一言,享受商业化的红利。
此外,AI大模型时代的到来,也将带来大量产业机会。李彦宏在发布会上称,大语言模型带来三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow(技术诀窍),调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
尽管“文心一言”和ChatGPT相比或许还有差距,但并不意味着其没有发展空间。
一方面,能够发布一款成型产品,百度在国内争夺的第一,确实领先了其他同行。另一方面,在国内用户和企业较难顺畅使用ChatGPT的情况下,需要一款本土产品来提供服务。“技不如人”的情况下,百度还可以靠本土化取胜。李彦宏也提到,百度在没有完全准备好的情况下发布“文心一言”,是出于市场的需要。
考虑到信息安全和数据安全等因素,中国必须要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技术门槛,目前中国能做语言类大模型的团队非常有限,有潜在能力做的只有10来个团队,最终能成的可能只有2-3家。
也就是说,百度或许并不需要和ChatGPT正面硬刚,只要在国内市场上能够占据领先位置,就能够享受中国市场所带来的红利和发展空间。
王晟认为,短期内,百度的“文心一言”或许没有达到市场预期,但从中长期来看,百度还是具备一定的竞争力。
新一轮AI范式变革,才刚刚开始。
*题图来源于视觉中国。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!