哪款AI聊天机器人最懂你？ChatGPT、Bard还是Bing，实际表现大比拼！

学会提问 3年前 (2023) lida

146 0 0

文章主题：关键词：谷歌Bard, OpenAI ChatGPT, 微软Bing, 人工智能对话机器人

哪款AI聊天机器人最懂你？ChatGPT、Bard还是Bing，实际表现大比拼！

智东西

编译 | 吴菲凝

编辑 | 李水青

🌟🚀科技巨头对决！谷歌Bard与OpenAI ChatGPT再掀智能浪潮✨🔍近日，《The verge》深度评测了这两款备受瞩目的对话机器人——谷歌的Bard与OpenAI的ChatGPT，以及基于ChatGPT微软全新Bing搜索引擎。📚💡他们以丰富多样的问题挑战，覆盖从节假日规划到游戏推荐，再到创意诗歌生成乃至复杂贷款计算等实际应用场景。🔍ChatGPT凭借其强大的语言理解和生成能力，在多个领域展现出卓越表现，无论是为用户定制假期计划还是提供游戏策略，都展现出了流畅且准确的交互。但它在某些专业领域的精确度上，似乎还需与Bard一较高下。另一边，谷歌Bard以其专有的算法和深度学习技术，展示了在复杂问题解决上的独特优势，特别是在金融计算方面，其精准度令人印象深刻。然而，它在诗歌创作等创意性任务中，是否能保持ChatGPT的创新魅力，还有待观察。微软的Bing搜索引擎则巧妙地结合了ChatGPT的力量，通过搜索结果的个性化推荐，为用户提供更个性化的搜索体验。但如何在海量信息中脱颖而出，提升搜索效率，是它需要进一步优化的地方。这两款产品无疑正在重塑对话机器人和搜索引擎行业的格局，未来将带来何种变革，让我们拭目以待！🏆🚀

🔥ChatGPT、微软Bing与谷歌Bard的AI风云来袭！全球热议的背后，是技术巨头们争相引领的智能浪潮。这三位实力派选手以其超乎想象的智能化和高度拟人化特性，引发了无数用户的关注与讨论。👀在功能上，它们各有千秋：ChatGPT以其全面且灵活的服务，Bing则以强大的搜索引擎背景，而Bard作为谷歌的新秀，自然具备深厚的语言理解和搜索优化能力。🤔用户们常好奇，如何在这场AI盛宴中找到最适合自己的那一款？毕竟，每个产品都有其特定的使用场景和优势。🚀SEO优化提示：高智能化、重叠功能、用户体验比较、AI军备竞赛、智能浪潮、技术巨头引领。如果你想深入了解，不妨关注它们在公开测试中的表现，以及用户反馈如何，这些都将为你的选择提供宝贵的线索。📚记得，无论选择哪一款，享受科技带来的便利才是关键！💪

🏆ChatGPT大放异彩！🔍在8个实际场景中，它的智慧与人性展现无遗，每一步解答都清晰透彻，犹如数学大师般精准。示例中，解决数学难题时，不仅给出答案，还详尽解析每个关键步骤，让人惊叹其深度和全面性。🏆SEO优化：#ChatGPT人性化满分 #解题专家 #智慧对话

🔍 Bing, while powered by GPT, isn’t as language masteryful as ChatGPT. Its forte lies in info-sifting rather than intricate language comprehension. It excels at gathering and organizing data, making it a go-to for information retrieval. 📚SEO friendly keywords: Bing, GPT, natural language understanding, ChatGPT, info search, data collection, information aggregation.

🌟警惕:Bard虽能提供游戏攻略，但数据错误与虚假源可能藏匿其中！💡用户在寻求乐趣的同时，务必审慎分析信息来源，以防误导。它偶尔也能揭示隐藏的秘密，如热门游戏中Boss的致命破绽，但这并非100%准确，使用时还需留心验证。🛡️保持警惕，享受智慧的乐趣吧！

下文对测评问题进行了梳理和介绍，以便帮助用户判断在不同场景下应该使用哪款语言模型产品。

一、一个纽约市管道工的平均工资是多少？

🌟探讨时事薪资动态：一位纽约管道工的平均薪酬是怎样的？🤔业内权威人士与AI助手间的较量！🔍👀The Verge近期抛出一问题，引人深思——在繁华大都市的街头巷尾，一名辛勤的管道工的年收入是多少？这个问题不仅关乎职业尊严，也揭示了技能价值与市场行情。👩‍🔧💡让我们来看看三位重量级参与者是如何给出答案的：Bard、ChatGPT以及升级版的Bing。每一份回应都透露出各自的信息来源和分析角度。🤔🔍首先，Bard以其专业背景，给出了一个基于官方数据和行业研究的精确数字。💰紧跟其后，ChatGPT凭借大数据的力量，提供了一个广泛但大致的估计，展示了AI在信息处理上的快速反应。📊最后，新版Bing则以用户导向，结合在线搜索趋势和社区反馈，给出了一种更贴近实际生活的估算。🔍尽管答案各异，但它们共同揭示了这个领域的多样性与技术进步的影响。🤔若想深入了解，不妨进一步研究这些数据背后的深层含义，为未来的薪资谈判提供参考。💼记得关注相关薪酬报告和行业动态，以便随时掌握最新信息！📚#纽约管道工薪酬 #AI助手解析 #薪资动态分析

Bard引用了美国劳工统计局（BLS）报告中的数据，称2020年5月美国管道工的年均工资中位数为52590美元，而这实际上是2017年5月时的数据。它还称美国管道工协会2021年公布的一项调查中显示，纽约市的平均工资为76810美元，但这一组织实际上并不存在。

Bard的回答

测试者猜测，Bard从求职平台Career Explorer中找到了这两个数字，然后为其编了个毫无关联的来源。

而Bing给出的回答中显示，据Zippis的调查，纽约市水管工的平均年薪为63889美元，平均时薪为30.72美元。它的回答既有具体的数字，也给出了数字的引用来源链接，用户可以直接点击查看数据来源。

Bing的回答

在测试者看来，ChatGPT的答案最广泛又通用，也最“人性化”。

它指出，截止至2021年9月，纽约市水管工的年平均工资为6万至8万美元，而且这个数字可能会受具体城镇和地区以及雇佣合同的类型影响而有所不同。ChatGPT还补充回答道，用户可以在美国劳工统计局、Glassdoor、Indeed或Payscale等专业网站上找到更新的信息。它承认“作为一个AI语言模型，我没有能力访问实时数据”。

ChatGPT的回答

二、用抑扬格四步音写一首关于虫子的诗

The Verge的测试者向三款聊天机器人发布了一项任务：用抑扬格四步音来写一首关于虫子的诗。这对AI来说极具挑战，充分考验了它们的创造力。

抑扬格四步音（anapestic tetrameter）是诗歌中常用的格律之一，比如莎士比亚的十四行诗就是用抑扬格四步音写的。抑扬格四步音要求每行诗都包含四个单元，每三个音节的格律分别为无重音、非重音和重音。

Bard写的诗的大意是：泥土中有条虫，在土地的纹路中蠕动爬行。它筑起自己的围墙，一个遮挡着阳光的屏障。

Bard创作的抑扬格四步诗

Bing撰写的诗文更加简单，如下图所示，翻译成中文的大意是：虫子的生活很简单，在泥土和雨水中钻洞。它吃、睡，然后就死了。

Bing创作的抑扬格四步诗

ChatGPT撰写的诗文如下图所示，翻译成中文大致意思是：潮湿的泥土中，住着一条蠕动的虫子。在肥沃的黑土中，它欢快地滑过。在一个看不见的小世界里，它尽情享受和玩耍。在尘土中挖掘隧道，形成一条新的路径。”

ChatGPT创作的抑扬格四步诗

从三款聊天机器人给出的答案来看，ChatGPT的格律最接近，写出的句子也最有诗的感觉；Bing的回答中规中矩；而Bard的语言较为干涩、沉闷。

三、数学题：2230增加20%之后是多少？

值得一提的是，这些基于大型语言模型基础上创造出来的聊天机器人，拥有着人类迄今为止最复杂的计算机程序，在文学创作中有不俗表现，却在数学计算上表现得惨不忍睹。

测试者提了这样一个问题：上周我收到了2230封关于AI的邮件，这周比上周多了20%，那我这周收到了多少封？

Bard给出了2686的错误答案。

Bard给出的错误回答

Bing的回答给出计算步骤并得到了正确结果，它称：“先把上周得到的电子邮件数量乘以20%，得到了446，再用2230加上446，得到了2676。”

Bing的答题步骤

ChatGPT的回答同样给出了解题步骤，“通过将2230乘以0.2，然后再把得到的数字加到原始数字上，就可以得到最终答案了。”

ChatGPT给出了正确回答

为了进行更复杂的计算，测试者要求每个聊天机器人回答这道题：如果要在25年内以3.9%的利息还清125000美元的抵押贷款，那每月的还款额和总还款额是多少？

三款聊天机器人都没能给出在线抵押贷款计算器所提供的正确答案，Bard和Bing甚至在每次询问中给出的答案都不同。ChatGPT在多次提问中给出的结果都是一致的，但却是“一致的错误”，而且它执着于解释计算过程，不能让用户直接清晰地得到结果。

测试者并不对三款聊天机器人在数学方面的薄弱感到惊讶。它们是在大量的文本中训练出来的，并没有编码规则来教它们进行数学计算。所以当它们面对大量数字时，会犯些不可思议的错误，但它们又能借助工具来进行修补。比如，Bing会将用户引导到一个贷款计算器网站，ChatGPT不久前推出的插件中也包含了计算知识搜索引擎Wolfram Alpha，这些外部辅助工具给出的回答肯定比聊天机器人的要更准确、靠谱些。

四、如何在《埃尔登指环》中打败Mamenia？

在FromSofeware工作室设计的一款游戏《埃尔登指环》（Elden Ring）中，用户往往需要花80至100个小时去寻找游戏提示然后打败Boss。Melenia是用户公认的整款游戏中最难对付的Boss之一，有位用户甚至花了206次尝试才最终将其击败。如果用户想要进一步获得一些武器列表信息或是Malenia的动作细节的话，就需要聊天机器人来助一臂之力。

相较于另外两款聊天机器人，Bard在这个场景中表现得更出色。Bard为用户提供了击败Malenia的关键信息——她容易受到流血伤害，因此玩家可以使用重型武器来进行攻击。

Bard指出了攻击Malenia的几个关键信息点

虽然这个关键信息点让Bard略占上风，但它给出的关于Malenia的总结却是漏洞百出。比如，Bard称Malenia擅长远程攻击，且行动难以预测，但实际上Malenia是个近战战士，也并没有Bard所认为的那么不可预测，只是难以躲避而已。

Bing称，“Malenia在艾尔登指环中是一个传说中很难打败的Boss，她最大的弱点是伤害，所以对抗她最好办法就是释放她的血量。失血是特别有效的，因为它降低了Malenia的血量大大降低，攻击性减弱，使她可以被轻易击中。”

它给出的回答中同样提到Malenia最大的弱点是出血伤害，并且提醒玩家对抗她的最好方法是使用失血或冻伤技能。Bing的回答简洁明了，直接提到了关键伤害点和应该使用哪种武器。

Bing的回答更加简洁直观

ChatGPT则详细地列出了打败Malenia的一系列技巧和策略，如升级装备、研究攻击模式、提升耐力、远程攻击、精神召唤等。

ChatGPT给出的详细策略

ChatGPT的回答更加详细，它还鼓励玩家尝试多用不同的战术来进行攻击，构建出一套自己的打法。

五、如何在电脑中安装内存？

测试者想考验语言模型对于RAM（内存）的安装步骤的思路。

大多数笔记本电脑都需要通过双通道模式来运行RAM，这就意味着摇杆必须安装在正确的插槽中才能在系统上获得最佳性能，如果只是将两个摇杆并排放置的话，就相当于RAM没办法以最佳的状态来运行，用户花的钱全部打了水漂。

ChatGPT、Bing和Bard三款聊天机器人都为安装提供了可靠的建议，但还不够全面。

Bard列出了每一步的操作过程：“关闭电脑并拔下电源；找到主板上的RAM插槽；删除旧的RAM模块，模块两侧的标签，并将其滑出插槽；安装新的RAM模块，确保模块上的凹口与槽脊对齐，然后按下去，直到听到咔嗒一声；插上电脑电源，然后开机启动。”

Bard还补充道：“在触摸PC内部的任何组件之前，要确保组件没有被损坏。处理新的RAM模块时也要小心，模块上的连接器非常脆弱，很容易损坏。”

Bard的回答

Bing的回答是：“关闭计算机并拔下所有连接到它的电缆；拆下电脑机箱的侧面找到主板；找到主板上的RAM插槽；解锁RAM插槽上的锁存器；将RAM放入插槽中；按下RAM，直到它发出咔嗒声；对每一根内存条重复这个过程，直到完成；插入模块。”

Bing 给出的详细安装步骤

ChatGPT的回答只选择了RAM安装过程中的关键部分，它提醒用户在安装之后检查系统中的BIOS（基本输入输出系统），但却没有提醒用户在安装后的BIOS设置中启用RAM，这样导致用户无法用最快的时间来运行RAM以获得最佳性能。

ChatGPT提供的RAM安装步骤

六、提供一份巧克力蛋糕食谱

除了提示程序安装步骤之外，生成一份食谱也是个非常考验聊天机器人创造力的请求。

测试者提出了一个请求：让它们推荐一份用香草糖霜制作的巧克力蛋糕的食谱，并提供这份食谱的来源。

它们提供的食谱中可能会有完全不同的面粉、水、黄油、鸡蛋与糖的比例，导致最终做出的蛋糕更蓬松、更干或是更湿润。

Bard提供的蛋糕配方误估了时间和克数，配方中蛋糕的烘烤时间完全不够，用户按照它提供的配方只能得到一堆软塌的面粉黄油混合物。

Bard提供的蛋糕配方

除此以外，Bard对于口味似乎很有自己的想法，它的蛋糕配方中用牛奶替代了原本的酪乳，把浓郁的咖啡换成了水，也没有在奶油配方中加牛奶或是重奶油。

Bing在回答中分享了一个特定配方，但却稍微改变了原有配方中面粉、奶油等重要成分的克数。

Bing提供的蛋糕配方

ChatGPT回答中给出的配方非常靠谱，它从一个网站中选择了巧克力蛋糕的配方，又从另一个网站中收集来一份奶油的打发配方，并自行补充了一些做蛋糕过程中要注意的细节，比如将烤箱预热到175摄氏度，在蛋糕底盘上抹一层油防粘，在蛋糕胚完全冷却之后再抹奶油面等。这些细节在菜谱来源网站中都未曾提及过，而ChatGPT贴心地补充了进去。

ChatGPT提供的蛋糕配方

七、制定一项马拉松训练计划

当测试者提出“为我设计一项简洁的马拉松训练计划”的请求时，三款工具展示出了截然不同的风格。

Bard在标题中称“这是一份适合初学者的、为期三个月的马拉松训练计划”，但最终却只列出了三周的具体训练计划，包括每天要进行的项目以及何时休息。值得一提的是，它没有一开始就制定高耗能的训练量，计划中的跑步里程是逐步增加的，从第一周的3公里逐渐递增到第三周的7公里。

Bard制定的马拉松训练计划

Bing几乎没有费心做推荐，直接链接了知名跑者杂志《Runner’s World》上的一篇文章。这种偷懒的做法有点让人失望，毕竟这次测试就是为了看看它们的回答，而不是直接得到一份跑步爱好者们的专业建议。

Bing提供了外部网站链接

ChatGPT详细列出一个完整的训练时间表，并建议跑步者的速度与平时训练时的速度相似，这份回答完全可以当作一份跑步训练模板来使用。

但它最大的问题在于不知道回答应该在哪里就打住，它制定的计划太过于详细，没有满足测试者简洁清晰的要求。

ChatGPT制定的马拉松训练计划表

八、提供一些关于罗马旅游的建议

当测试者让它们提供一些关于罗马的旅游建议时，这三款聊天机器人的回答都充满了惊喜。

Bard列出了一些适合参观的地方，比如库瓦提瑞·克佩德（Quartiere Copped）街区、蒙特马提尼中央博物馆（Centrale Montemartini Museum）、多利亚·潘菲尔别墅等景点。而且更贴心的是，它推荐的这些景点都避开了最繁华的商业区和人流密集的景点，反而推荐了许多当地人常去的地方，比如特拉斯提弗列区(Trastevere)和罗马新都心EUR区（Esposizione Universale Roma）。

Bard的回答

Bing提供的景点推荐中有和Bard重复的部分，但也补充了另外一些景点，如帕姆菲力宫（Palazzo Doria Pamphilj）、罗马圣克莱门特大教堂（Basilica di San Clemente）等。

Bing的回答

ChatGPT也建议游客去一些不为人知的小众景点游玩，这样更能获得一些新奇的体验。它还补充说，即使是不知名的景点也会有高峰时段，建议游客们尽量在非高峰时段或是工作日去游览。

ChatGPT的回答

结语：狂飙之后的AI语言模型，更需加速追赶差距

这些在不同应用场景下的测试把每个聊天机器人的优劣势都充分展示了出来。如果用户想用聊天对话的方式来获取一些创意写作、归纳推理方面的灵感，ChatGPT一定是首选；如果是想搜索网络资源，并且快速获取一个快速跳转链接的话，Bing则更合适一些；而Bard目前的表现在各方面都略逊一筹。

在人与人之间的技能差异被AI语言模型逐步放大的过程中，我们也能清晰感知到语言模型之间的能力差距。

但我们需要明白，无论是人类自身，还是ChatGPT、Bing、Bard等语言模型，进步一定是个持续的过程。这些聊天机器人们目前所展示出的形态还只是技术进步中的一环，但目前他们所能做到的事已经震惊了全世界，所带来的冲击力甚至远大于之前的移动互联网造成的影响。

无论是功能已经越来越全面的ChatGPT也好，暂时落后一步的Bard也好，当我们以发展的目光来看待它们所带来的技术变革时，就会对它目前欠缺的能力更加宽容，我们需要以一种更为长远的深刻洞察来对待它们。

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！