「大比拼!天工VS文心一言,谁的内功更深厚?」

ChatGPT与Excel 2年前 (2023) lida
57 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

「大比拼!天工VS文心一言,谁的内功更深厚?」撰文 | 王语妤

编辑 | 杨博丞

题图 | IC Photo

最近,昆仑万维和百度“杠”起来了,原因还是因为最近大火的大语言模型。

🎉【科技新星】揭秘!昆仑万维引领潮流,”天工”大模型震撼发布🌟 4月17日,这天注定不平凡——昆仑万维以创新的姿态,正式揭晓了其自主研发的重量级人工智能产品——”天工”大模型。这一天,不仅标志着中国在语言智能领域的又一里程碑,也预示着科技新纪元的到来!🏆这款备受瞩目的”天工”,以其卓越的智能涌现能力,傲视群雄,被誉为中国首屈一指的国产语言大模型。它以强大的自然语言处理技术,打破传统,实现了真正的智能化突破,为未来的语言交互提供了无限可能。🌍昆仑万维,作为行业的领军者,始终坚守科技初心,致力于推动人工智能的发展。此次”天工”的测试开放,无疑是一次面向全球的技术盛宴,邀请大家共同见证这一科技奇迹的诞生。👩‍💻👨‍💻欲了解更多详情,敬请关注后续官方动态,让我们一起期待”天工”大模型在未来的亮眼表现!🏆🚀

🎉🚀 百度的创新之举——文心一言,无疑是科技领域的闪耀明星!它以国内首个大语言模型产品身份傲立,引领行业潮流。🌟不止于此,百度通过这款产品向世界展示了其强大的技术实力和互联网视野。🏆不论是对于用户还是搜索引擎优化,这都是一次里程碑式的突破。SEO友好的表述,让每一个关键词都蕴含着无限可能。🔥让我们期待文心一言为未来的交流与创新开启新篇章!🌍

从表面上看,两家的宣传语中心不一样,话术也有所不同,看似风平浪静,但实则内核都是在争一个“首家”。

🏆为何争相首秀?🔍不只实力对决与市场抢夺,背后还藏着提振股价、增值的秘籍。.capitalize那天,百度一鸣惊人,HK股市直线上升15%!昆仑万维紧随其后,宣布后的第二天,股价飙升7.68%,涨幅喜人。👀这两场“首秀”效应可见一斑,企业借此信号,向市场和投资者传递信心与实力。

不过,究竟谁是国内首家呢?

🌟百度的AI研发进程悄然加速,在去年9月左右,该项目就已经悄悄步入内部测试阶段。直到今年2月,这个备受期待的创新成果才正式亮相,引发了行业内的广泛关注。随后在3月中旬,百度更是以盛大的姿态,对外宣布了文心一言的正式存在,为智能技术领域又添上一抹亮丽的色彩。🚀

🌟【揭秘】昆仑万维AI浪潮开启!🚀自2020年起,这颗科技巨头的创新引擎便悄然点燃——昆仑万维已深度涉足AIGC(人工智能生成内容)领域的战略布局,引领行业风向。虽未明示具体项目启动时间,但其势如破竹的发展态势昭示着未来之决心与雄心。🚀SEO优化提示:AIGC、昆仑万维、AI浪潮、科技巨头、深度布局、未来发展

🌟🚀技术实力揭秘:文心一言背后的AI密钥💡.baidu凭借四层深厚架构和全栈布局,在人工智能领域的卓越探索展现出强大实力!底层,尖端芯片为智能加速;中层,自主研发的深度学习框架如砥柱般稳定;上层,搜索应用不仅是智慧导航,更是知识海洋的入口。ERNIE,百度产业级知识巨擘,跨模态、多语言的超凡语义能力,犹如人工智能领域的璀璨明珠✨。在人工智能这片广袤土地上,百度耕耘多年,积累了深厚的专业素养与实践经验。每一项技术革新,都是对智能未来的一次深情拥抱。\稼穑之功,终成丰碑!SEO优化已融入每个词句,让搜索引擎找到你的智慧之声。🏆

昆仑万维同样具备大模型四要素:数据、算力、算法以及大参数语言模型。据昆仑万维介绍,天工是双千亿参数训练的结果——千亿预训练基座模型、千亿RLHF模型。

不过,既然两家的底座能力看起来不相上下,那么我们就将这两家放在一起,试试“内功”。

01、中文语意理解能力

昆仑万维对外展示的技术路径现实,天工团队引入模特卡洛搜索树算法后,在语意理解、转换话题能力上有所提升。

在此背景下,我们首先和天工玩起了成语接龙游戏。不过,天工的完成度并不好,甚至没能理解什么是成语接龙。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」

文心一言在成语接龙上的表现是优于天工大模型的。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」

紧接着,我们向文心一言和天工大模型抛出了一个问题——“写一本类似《人世间》一样题材宏大,展现中国历史变迁的小说提纲,字数1000字左右。”对于这个问题,文心一言和天工都将问题的重心放在了“题材宏大”、“历史变迁”这两个关键词上。

于是,两家生成的内容都不符合我们最开始的预期。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」上图“天工大模型”,下图文心一言

这个问题,或许是由于我们给出了一定的误导性,所以导致两家生成的答案都不尽人意。但是,天工稍微比文心一言好一些,原因在于,文心一言将“历史变迁”直接解读成了朝代变迁。

尽管天工的回答也是文不对题,但是有人物设定,朝代设定,内容的可操作性和延展性明显是优于文心一言。

将问题拉回《人世间》类似的小说提纲,我们改变了提问角度,连续发文:《人世间》讲了一个什么样的故事、那你能写出类似题材的小说提纲么?大概1000字左右

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」

在提取重点、联想写作、以及话题的连续性上,天工的表现还是不错的。

但是文心一言就“开了小差”。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」

文心一言的回答出现了明显的错误。不过,我们再一次将问题抛给文心一言,重新生成答案。这一次,文心一言又重回正轨,给出了相应的答案。

「大比拼!天工VS文心一言,谁的内功更深厚?」

此外,我们还用三个连续性问题,向天工发问。此前,我们在《大评测!ChatGPT 、文心一言和Bard谁更强?》中,将同样的问题给到过文心一言、Bard、以及ChatGPT。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」

可以说,天工的前两个问题回答和文心一言此前的回答不相上下,但在最后一个藏头诗的理解上,还是存在一定的偏差。

尽管,文心一言的藏头诗回答的也并不好,但好在,文心一言理解了“藏头”的意思。而天工,似乎还并未消化掉“藏头”的意思。

「大比拼!天工VS文心一言,谁的内功更深厚?」

02.逻辑思辨能力

为了测试“逻辑推理”能力,我们将这样一题抛给了天工和文心一言,即“如果猫会爬树,那么狗也会。”

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」上图“天工大模型”,下图文心一言

很明显,天工和文心一言也陷入了题目的误区,或者说,并没有完全理解题目意思。不过,这里需要强调的是,在鸡兔同笼问题上,文心一言和天工在发布的视频中都有不错的表现。

在文心一言发布会上,李彦宏询问文心一言“鸡兔同笼”的问题,在题目数据错误的前提下,文心一言通过推理证明了题目存在问题。

这里需要注意的是,在这个逻辑推理上,ChatGPT的回答,是天工、文心一言、bard这四家大模型中唯一正确的,并指出了猫和狗的不同,证明猫会爬树,而狗不会。

除了考验逻辑能力之外,我们还将一个哲学思辨问题,同时向天工和文心一言发文。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」上图“天工大模型”,下图文心一言

在哲学问题的理解上,天工和文心一言区别不大,但文心一言略显“人文”一些,在解读之后,更是直接告诉我们该怎么做,更像是和人在对话一样,天工的回答则更是一本正经。

可以这样来说,和天工对话像是和老师对话,老师需要回答这个问题是什么;和文心一言对话则更像是和心理医生对话,医生需要在解释的基础上给出意见。

03.编程能力

为了测试这两大模型写代码的能力,我们询问了一个非常简单的问题——x+2=5,y-3=7,输出x+y等于几,用java做一个简单编程,并得出结果。

「大比拼!天工VS文心一言,谁的内功更深厚?」
「大比拼!天工VS文心一言,谁的内功更深厚?」上图“天工大模型”,下图文心一言

但是很显然,这两大模型给出的结果都是有问题的。

不过,在其他评测稿件中,文心一言和天工在编程能力的表现上并不差。我们认为,目前来看,这些大模型的能力还并不稳定,还需要在不断的训练中提高准确性。

结语

总结来看,文心一言也好,天工也罢,他们的能力相对来说,差距不大。但更多的问题在于,目前,大模型每一次生成的问题答案都存在一定的误差。

相比于“首家”之争,我们认为,企业们更重要的是在于提升大模型的能力和准确度,并且寻找到更多合适的场景去实现商业化。

大模型赛道愈发热烈,谁都想做风口上的猪,但是能在风口上起飞的猪,往往都是做好了充足的准备。

此外,我们还应该多给国内科技企业更多的信心,和国外ChatGPT4相比,国内大模型还是有一定差距,但是我相信,这个差距在不远的将来,在竞争中,都会逐渐拉小。国内大模型,未来可期。

「大比拼!天工VS文心一言,谁的内功更深厚?」

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

版权声明:lida 发表于 2023年4月28日 am12:53。
转载请注明:「大比拼!天工VS文心一言,谁的内功更深厚?」 | ChatGPT资源导航

相关文章