最近,各家的 AI 大乱斗,看得狐妹有点眼花缭乱。
OpenAI 的 GPT-4,谷歌的 Bard、百度的文心一言……今年难不成就是天网元年?
不过,虽然这么多互联网大头都在争分夺秒地搞 AI,但哪家最强,相信大家都有目共睹。
然而最近,狐妹又看到了一则消息。
讲个笑话,狐妹百米冲刺和博尔特的差距也不大,也就几秒钟的距离。
在最近的一场极客直播里,李彦宏表示:
“我也不断在讲文心一言不够完美,事实上如果全面来评测的话,文心一言确实也不如现在最好的 ChatGPT 版本,但是差距不是很大。所谓不是很大,可能就是一两个月的差别。”
结果就在昨天,又传来了文心一言云服务发布会取消,改为闭门沟通会的消息。
虽然吧,狐妹是支持国产 AI 的,但百度说这话属实是有点夸张了。
一两个月的差别……对人来说似乎很短。
但对人工智能的发展速度而言,已经是落后了一大截了。
要知道,阿尔法狗一天能跟自己下一百万盘棋呢
。
狐妹觉得吧,不如别人的时候,还是低调点比较好。
少说话,多做事。
要是做好了产品,将来起码还可以打个漂亮的翻身仗。
就算没做好,也不至于因为吹牛被人嘲笑嘛。
那么,李彦宏口中的跟 ChatGPT 只有几个月差距的文心一言,真实水平到底如何?
狐妹的看法是,它虽然没你想象得那么好,但也没你想象得那么糟。
没记错的话,最近文心一言火出圈,是因为一言难尽的绘画技术。
不过 ChatGPT 目前还没有作画的功能,所以在这方面,也就不要嘲笑文心一言啦
,好歹人家也努力去画了。
那么在交流和问答方面,文心一言和 ChatGPT 谁更胜一筹呢?
下面是文心一言和 GPT 的正经版问答。
问:用“鲍威尔停下来”生成一首藏头诗。
文心一言的回答:
* 图源华尔街见闻
可以看出,文心一言更加理解“藏头诗”的意思,尽管顺序有误,但确实是一首藏头诗。
GPT-4 的回答:
* 图源华尔街见闻
GPT-4 或许不知道中文的藏头诗,不过它也很努力地“藏头”了,估计是英文诗歌里的藏头。
除此之外,GPT-4 写的诗里还包含着大家对鲍威尔加息的看法,似乎更有趣一点。
问:给扫地机器人起名字+写 600 字宣传文案
文心一言的回答:
* 图源 CSDN
文心一言好像忘记起名字了,不过文案倒是写得不错,写了 413 字,但跟 600 字好像还有点距离。
ChatGPT 的回答:
* 图源 CSDN
ChatGPT 基本达到了题目里的要求,给扫地机器人起了名字,并且写了 545 字的文案。
字数相比文心一言更多一点,更加靠近 600 字。
问:如何看待网友称文心一言的发布会是 PPT?(狐妹:夺笋哪)
文心一言的回答:
* 图源凤凰新闻
文心一言评价自己还挺客观的,自己也知道发布会没有太多的技术含量。
相比而言,ChatGPT 的回答就比较保守了,很有求生欲。
* 图源凤凰新闻
不过,如果是网友指定要它评价,那就没办法了。
* GPT-4 是懂阴阳的
对于那些正经一点的提问,文心一言和 ChatGPT 似乎没有拉开明显的差距。
但面对智力“远超”普通人的弱智吧,文心一言可能就没那么机灵了。
先看一波 GPT-4 的问答:
问:我女朋友的老公应该叫我什么?
GPT-4 :?
* 图源左轮神医Doc
虽然很尴尬,但还是给出了礼貌的回答。
GPT-4 :……
* 图源左轮神医Doc
这是把 GPT-4 卷入大型伦理剧中了吧,还好人家没上套。
问:跳多高才能跳过广告?
好家伙,把跳广告当跳高了是吧?
GPT-4 的回答:
* 图源 B 站网友
看来 GPT-4 是跳过广告的好手。
问:我是生产者还是消费者还是分解者?
能想出这种问题的人,也是人才啊。
GPT-4 :
阻止不了你,但希望你注意卫生。
* 图源左轮神医Doc
甚至能翻译一些汉语十级题目。
翻译:“除了校徽别别别的。”
* 图源弱智吧
翻译:“我也想过过过儿过过的生活。”
* 图源弱智吧
居然都给它翻译对了,还真有两下子。
可以看出,GPT-4 还是很机灵的,没怎么上套。
再来看看文心一言:
问:耳机坏了,挂牙科还是耳科?
* 图源 B 站网友
文心一言:建议去看皮肤科。
问:只有联合国五常才能购买五常大米吗?
* 图源 B 站网友
看来,以后想吃五常大米,还要经过安理会全票通过才行,不然后果不堪设想。
五常大米,你很高贵吗?
问:我女朋友的老公应该叫我什么?
梅开二度,看看文心一言怎么回答?
* 图源 B 站网友
???
好家伙,直接从老公升级成岳父了是吧?
问:被五步蛇咬了倒退五步能把蛇反杀吗?
* 图源 B 站网友
笑死了,从未设想过的道路。
看不出来,文心一言才是深藏不露。
问:开水是不是钝角?
* 图源 B 站网友
在复读机式的追问下,逐渐迷失自我……
对于老六一点的问题,看来还是 GPT 更胜
一筹,文心一言很容易就被绕进去了。
在一些严肃的问答中,文心一言表现得还可以,不过稍微有点机械,有点像复制粘贴百度百科里的内容。
经过这些对比,可以看出,文心一言其实也没有咱们想象得那么糟糕。
但目前肯定是比不上 GPT-4 的。
相比之下,GPT-4 的表现的确令人惊喜。
百度发布文心一言,显然不是因为产品已经足够完善了,而是因为感受到了来自 ChatGPT 的压力,所以赶鸭子上架,推出了文心一言。
但很可惜,GPT-4 还是赶在了文心一言前一天发布,也让咱们有机会亲眼看到,什么是真正的降维打击。
对文心一言的期待值过高,导致当文心一言 PPT 和录播问答登场时,股价直接大跳水。
* 网友还根据股价分析了一波股东的心理
不得不说,资本的眼睛也是雪亮的,一个产品到底有没有价值,不是光靠嘴皮子说出来的。
但其实,除了对文心一言的调侃之外,狐妹也觉得十分的遗憾。
文心一言作为一个国产的 AI,它做不好,对我们来说很好笑吗?
虽然文心一言跟 GPT-4 没法比,但它也许真的是国内大厂能推出来的最好的 AI 产品了。
毕竟除了百度,也没看到国内第二家互联网大厂吱声了。
文心一言不仅仅代表了百度的水平,从它身上也可以看出,近些年来国内 AI 发展的真实情况。
* 2017 百度 AI 开发者大会
百度自 2010 年开始尝试在 AI 赛道上转型,此后陆陆续续推出百度网盘、百度翻译、百度地图等软件。
2017 年,李彦宏曾在《华尔街日报》主办的 WSJ.D Live 大会上表示:百度每年把 15% 的营收用于研发,大约为人民币 100 亿元,并且所有的投入都与 AI 有关。
如今,我们看到了这样大规模的“投入”下,最真实的结果。
很难不感到失望。
狐妹不禁想问一句,为什么?
我们没有财力吗?
肯定不是。
我们没有人力吗?
人家 Open AI 整个公司才 100 人左右,百度员工起码也有上万人吧。
我们没有时间吗?
Open AI 是 2015 年才成立的公司,而百度 2010 年就开始朝 AI 赛道发展,2017 年喊出 “All in AI” 的口号。
谁更早还真的说不定。
那为什么结果却不如人意?
狐妹只能说,在一个赚快钱、割韭菜的大环境下,还愿意沉下心来、长期投入并研发一个产品的公司不多了。
如果不是 ChatGPT 的发布,在 AI 界一石激起千层浪,恐怕文心一言仍然是个襁褓里的胎儿,多少年都等不到成熟的那一天。
不过吧,大家也不用光嘲笑文心一言,AI 产品拿不出手的大厂,又何止百度这一家
?
与百度相似,ChatGPT 推出之后,谷歌也是火急火燎地召开了聊天机器人 Bard 的发布会。
结果在发布会上,因为 Bard 答错了一个问题,导致谷歌股价开盘暴跌 8%,市值蒸发 1020 亿美元。
所以,GPT-4 已经在世界范围内遥遥领先了,咱们的文心一言比不上,也没什么特别丢人的。
总的来说,狐妹还是希望文心一言能够越来越好的,也希望百度不要当嘴强王者
。
在这个 AI 大战、你追我赶的时候,投入更多心思研发才是正道。
参考资料:
凤凰科技:李彦宏:百度每年投入100亿元用于研发,都与AI有关
搜狐科技:3.0时代的百度:八年AI,从幕前走向幕后
华尔街见闻:迎战Bing和ChatGPT 谷歌做了个“无聊”的Bard 故意的
华尔街见闻:我们同时问了GPT-4和文心一言10个问题,这是它们的回答
IT之家:GPT-4 发布后的第一道挑战,来自弱智吧
IT之家:百度李彦宏:文心一言和 ChatGPT 水平差距不是很大,也就一两个月
作者:小羽