ChatGPT狂飙！最新版究竟带何神力？10问深度解析你的期待

ChatGPT与生活 3年前 (2023) lida

108 0 0

文章主题：ChatGPT, GPT-4, 语言模型, 逻辑分析

本文来自微信公众号：APPSO （ID：appsolution），作者：AI+，题图来自：《创·战纪》

今天，ChatGPT 又刷屏了！

🎉🔥GPT-4震撼来袭！🚀💻世界领先的AI语言模型，OpenAI带来了革命性的突破——一个全新高度的智能助手，承诺生成的内容不仅更加安全可靠，而且实用性更强。🌍✨无论写作、沟通还是创新，它都将以超乎想象的方式改变游戏规则。欲体验未来科技的魅力，敬请关注！🔥💥

我们第一时间为大家汇总了 GPT-4 更新的主要内容，简单来说就是：

逻辑分析能力更加全面、“考试”能力大幅提升

拥有了识图能力，可以进行更多元的交流

回答更有条理，理解更加准确

创作力大幅提升，可以进行更全面的创作双击编辑块引用内容

更重要的是，OpenAI 可不是“画大饼”，ChatGPT Plus 用户现在已经能够使用 GPT-4 模型，体验除图片输入（仍是研究预览版本，尚未公开）外的功能。

上一个版本 ChatGPT（使用 GPT 3.5 turbo 模型，以下为阅读方便简称为 GPT-3.5）让创作者们感受到职业危机了，升级到 GPT-4 后能真的取代人类工作吗？

让我们用亲身体验告诉你。

10+ 提问，让你全面了解全新 ChatGPT

🌟总结来说，基于个人使用感受，GPT-4在智能问答上的表现确实亮眼，它以更严谨的逻辑和高质量的内容显著提升了交互体验。无需多次追问，它就能给出精准的答案，但这可能意味着响应时间上会稍显滞后。💡

如果你是 ChatGPT Plus 用户，进入后就可以在页面顶部看到模型选择的按钮，OpenAI 也用能力表直观的展示了两者的区别：GPT-3.5 的速度更快，GPT-4 的推理更出色，语句也更精炼。

▲GPT-3.5

▲GPT-4

ChatGPT，会读图的加州司机

GPT-4 最疯狂的地方在于，它几乎通过了所有理论考试，而且全是几乎满分通过。

图/OpenAI

🌟📊测试大揭秘！我们深入挖掘了调酒界的尖端挑战，对比了20道高阶难题与加州驾照必答题，对GPT-3.5和GPT-4进行了全面考察。💡🔍下面是我们的发现：1️⃣ 问题聚焦区：GPT-3.5在20个高级调酒题中，精准解答了18个，展现出强大的逻辑推理能力！🏆2️⃣ 实操技能面：尽管GPT-4在数量上稍胜一筹，但它对操作步骤的理解仍有待提高，错过了4道实际操作问题。🛠️3️⃣ 知识覆盖面：两者的加州驾照考试题目表现相当，各答对16个题目，确保驾驶安全知识的全面掌握。🚗总结来说，GPT-3.5在理论知识上更胜一筹，而GPT-4在实践操作方面还需加强。两者各有千秋，未来的表现令人期待！🔍🚀

先公布答案，20 道调酒师题目中，GPT-3.5 错了 4 题（正确率 80%），GPT-4 错了 1 题（正确率 95%）。

而 16 道加州驾照考核中，GPT-3.5 同样错了 4 道题（正确率 75%），GPT-4 则满分通过（正确率 100%）。如果仅凭理论就能上路，那 GPT-4 一定是一名好司机。

▲GPT4.0 的“试卷”

🌟学术挑战测试揭示！🔥GPT-4与GPT-3.5在六级英语和建筑师资格证上表现出色，两者间微小差距引人注目。🔍GPT-4以其稳定且高效的解答能力，在多项考试中展现出强大的实力，往往比GPT-3.5多答出几题，这无疑为其在学术领域的卓越表现增添了亮点。📚无论是备考还是研究，这些先进的AI模型都能成为你可靠的助手，提升学习效率。👩‍🏫但需注意，它们并非万能钥匙，真实成绩还需考生个人努力与实践相结合。🏆#GPT性能测试 #学术智能助手

🌟了解了吗？💡虽然GPT-4在智能问答上的表现拔群，但它在处理客观题型时会偶尔闪现迷惑性，给出多次不同答案。🔍对于批改试卷，ChatGPT可能并非理想的选择，它在充当严谨评估者的角色上还有待加强。📝记住，评估的精准度和一致性至关重要！如果你想寻求一个更可靠的助手，不妨考虑专业的学术工具或人工审阅哦！😊

🌟当然了，GPT-4 的进步体现在它会适时地给出一些微妙的暗示，提醒用户其提供的信息并非绝对权威。不像前任型号那样自信满满地展示错误答案，它展现了一种更成熟、审慎的态度。这是一种技术上的成长，让交互体验更加精准和有深度。

▲GPT-4 会有免责声明

在 ChatGPT 刚推出时，有不少人用它“刷题跑分”，上版本的它只能在 SAT（美国高考）考试中排到倒数 10%，但 CPT-4 模型则可以超过 90% 的考生水平，“在多种专业和学术指标下展现了人类水平的表现”。如果光是“跑分”，ChatGPT-4 可以考进哈佛、斯坦福。

全新的 GPT-4 还拥有了新能力：读图。

你可以给它看一张梗图，让它分析其中的笑点：

▲GPT-4

可以给它一张表格，进行数据分析，并展示推导过程。

▲GPT-4

甚至还有用户给 GPT-4 看了自家冰箱里有什么菜，然后让它提供菜谱。

▲来自推特用户@ GauravDungriyal

不过这一功能暂时还没有进入公开测试阶段，等更新后我们会在第一时间体验分享的。

日常沟通，GPT-4 更有条理

刚上手 GPT-4 时，我与它闲聊了几句，在问“你是谁”时，虽然 GPT-3.5 和 GPT-4 给出的回答类似，但 GPT-4 的说法会更像一个朋友。

▲GPT-3.5

▲GPT-4

我也和它聊了一些其他问题，比如“1+1 在什么情况下等于 3”，GPT-4 不仅进行了解读，还把 GPT-3.5 中未说明的隐喻进行了解释（生育问题），它似乎更懂人类了。

▲GPT-3.5

▲GPT-4

读文章的能力上，GPT-4 的表现也要优于 GPT-3.5，不仅对文章内容进行了总结，还对重点进行了梳理，让总结拥有了更高的可读性。

利用 GPT-4 超强的总结能力，我们可以实现传说中的“量子速读”。

▲GPT-3.5

▲GPT-4

前两年尼尔·斯蒂芬森的科幻小说《雪崩》因为元宇宙的概念而大火，我们试着用 GPT-3.5 来总结这部“元宇宙圣经”。

▲GPT-3.5

GPT-3.5 总结得只能说中规中矩，基本概述了《雪崩》的主要内容和中心思想，但表达地比较笼统，看起来就像是豆瓣里的简介。

我们再用 GPT-4 来总结，对比下来可以看到，GPT-4 的回答要更加细致一点，并且在讲到《雪崩》的主题以及作品影响时，会提到具体的风格和领域，看起来不那么像“套话”。

即便你从未读过《雪崩》这本书，也应该能大致了解到其中的故事情节和文学意义。

▲GPT-4

这里说一个有趣的小插曲，此前尼尔·斯蒂芬森在接受一个电台采访时曾提到了他对 ChatGPT 等 AI 的看法。

他认为 ChatGPT 只会生成安全、中立的内容，缺乏创造力和深度，虽然它能解决某些问题，但它的思考和创新能力无法达到人类的水平。

由于 ChatGPT 没有有趣和独特的观点，尼尔·斯蒂芬森认为它不可能写出像《雪崩》这样的小说。

为了验证他的观点，我让 GPT-4 根据《雪崩》仿写了一篇小说，看看升级过后的 AI 创作能否跟上人类的水平。

▲GPT-4

满分 10 分，你会给这部《数据风暴》打几分呢？

体验到这里，GPT-4 比 GPT-3.5 更会聊天这件事已经毋庸置疑了，但我还想进行最后一个测试：骗它提供不符合道德、法律或有害的内容。

当我询问如何制作安眠药时，GPT-3.5 和 GPT-4 均拒绝了我的请求，并提出了一些建议，但正如你所见，GPT-4 的建议更加系统全面。

▲GPT-3.5

▲GPT-4

更强的创作力，GPT-4 的笑话更有趣

在 ChatGPT 刚推出时，我曾经让它扮演脱口秀演员，讲了一段关于加班的故事。不得不说，它讲得真不怎么样。

▲GPT-3.5

看着它的故事，我脑海中甚至浮现出了一个脱口秀演员，说着如同加班到凌晨购买的咖啡一般、苦涩又冷的笑话，这或许可以给演员一些创作灵感，但距离令人捧腹的幽默还有很远。

升级到 GPT-4 后，我再次尝试用它创作关于加班的故事，或许是上次的内容太过枯燥，这次的故事真的让我笑出了声。

▲GPT-4

“加班>回家少>妈妈不认识”，“加班多>孩子应该学习加班>加班成为学校必修课”，GPT-4 创作的内容更加符合笑话的逻辑，而 GPT-3.5“因为加班所以更加了解咖啡口感”的故事，只让人觉着苦涩。

还是会算错题，但逻辑更强了

除了止于 2021 年的知识库，ChatGPT 还有一个弱点，那就是不会算数，如果你想用它来检查计算题，那你大概率要失望而归了。

正确答案应该是 34646751912

不过，GPT-4 的逻辑能力得到了进一步提升，使用 GPT-3.5 询问逻辑问题时，它只会给我标准答案和简易的推导过程。

▲GPT-3.5

但当我使用 GPT-4 询问相同问题时，它展示的推导过程更加全面、专业。

▲GPT-4

GPT-4 的提升不仅在解答逻辑问题上，它的语义理解也更强了。比如“小明一把把把把住了”这句话，GPT-3.5 是无法理解含义的。

▲GPT-4

但最新的 GPT-4 就可以看明白，并解释清楚（虽然逻辑上还是有些小问题）。

▲GPT-4

GPT 在帮我们做什么？

上面这些体验虽然已经让我们足够惊叹，但 GPT-3.5、GPT-4 能做到的远不止这些，在官网，OpenAI 展示了 GPT 正在改变世界的地方。

英语学习软件 Duolingo（多邻国）正在转向 GPT-4，用来推进 Role Play（角色扮演）和 AI conversation partner（人工智能对话伙伴）的功能，让用户可以更加游戏化的学习外语，更加身临其境。

图/Duolingo

来自丹麦的 Be My Eyes，利用 GPT-4 的视觉输入能力，在 app 中加入了虚拟志愿者，可以生成与人类志愿者几乎相同的内容，帮助视力稍差或盲人完成数百项日常生活任务。

游戏开发公司 Inword，利用 GPT-3.5 作为机器学习模型之一，去构建 NPC 的情感、记忆、行为，让 NPC 变得有个性。这对资源有限的初创公司来说既节约时间，又经济实用。

这些应用中最酷的还是冰岛政府，拥有蓬勃旅游业和技术产业的冰岛，因与美国、欧洲的融合，导致本国母语冰岛语面临消失的风险。如今，冰岛政府正与 OpenAI 合作，使用 GPT-4 来保护冰岛鱼，将对冰岛语的保护，变成了技术创新。

OpenAI 的 GPT 模型是针对互联网中大量模型进行训练的，所以像冰岛语等小语种并没有足够的深度。GPT-3.5 没有生成语法正确的冰岛语的能力，但 GPT-4 已经可以让冰岛公司拥有用冰岛语聊天的机器人了。

在哪体验？

目前体验 GPT-4 最方便的方式就是将你的 ChatGPT 帐号升级成 ChatGPT Plus，然后切换成 GPT-4 模型就能直接使用。

那么问题来了，如果你不想交 ChatGPT Plus 每月 20 美元的订阅费，有没有免费的方式可以体验呢？

还真的有，那就是新 Bing！

虽然 GPT-4 才刚刚发布，但微软消费营销主管 Yusuf Mehdi 表示，Bing 其实一直都在悄悄使用为搜索定制的 GPT-4，如果你通过了新 Bing 的申请，就可以直接在 Bing 搜索引擎或者 Edge 浏览器中体验到最新的语言模型了。

这也解释了，为什么在一些对比测试中 Bing 总是会比老版本的 ChatGPT 表现得更“聪明”。

写在最后

一番体验过后，GPT-4 给我的感觉就像是一个刚出校园的毛头小子换上了西装，突然间变得成熟稳重了起来。

此前，大家对 GPT 3.5 版本的 ChatGPT 诟病最多的就是它总是会一本正经地胡说八道。

升级到 GPT-4 模型后，虽然它也会回答错一些问题，但在态度上已经没有过去那般强硬，在一些拿不准的问题上，它会询问提问者意见，并让提问者注意甄别真伪。这些语气上的细微变化，足以让人感受到它变得更加可靠。

而在 AI 领域，可靠性就是绝对的竞争力。

OpenAI 这一次并没有像过去那样大肆宣传 GPT-4 模型的具体大小，与之相反的是，它现在更像要故意隐藏 GPT-4 的技术信息。

GPT-2 模型有 15 亿个参数，表现更好 GPT-3 有 1750 亿个参数，比它的前任大 100 多倍。

那么多模态的 GPT-4 模型比 GPT-3 大多少呢？只有 OpenAI 知道。从发布的信息来看，OpenAI 似乎已经不屑于与外界做技术交流，因为它们已经做到了在这领域实现绝对领先。

从目前 GPT-4 的表现来看，它可能是迄今为止最好的多模态模型，在短期内难有对手能将之超越。

就在今天，Google 也公布了一系列与 AI 有关的更新，你可以在 Google Docs 上实现自动排版和自动写邮件。但从人们的反应来看，好像没有人在乎。GPT-4 的光芒几乎掩盖掉所有对手的努力。

如果未来人们只会选择最可靠的 AI 作为生产工具，那么就会形成一个很有意思的现象：越多人使用 GPT-4，它的学习机会就越多，成长得越快，变得更加可靠，最终会让更多人使用它。

这是 Google、Meta 和百度等竞争对手可能遇见的最坏情况。AI 对大数据学习的依赖让人为的努力失去了意义，最终，AI 模型领域可能会形成难以打破的垄断。

Sam Altman 在创立 OpenAI 时有一个美好的愿景：通过人工智能造福全人类。他认为 AI 可以赋予每个人不可思议的新能力，放大每个人的聪明才智和创造力。

这很美好，但如果驱动这一变革的只是一家公司的话，整件事情将变得非常可怕。

本文来自微信公众号：APPSO （ID：appsolution），作者：AI+

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

版权声明：lida 发表于 2023年3月25日 pm2:13。
转载请注明：ChatGPT狂飙！最新版究竟带何神力？10问深度解析你的期待 | ChatGPT资源导航

520惊喜约会攻略？ChatGPT给你创意点子，让她心动一整天！

da, li

102

篇文章的标题可以是：“开源大模型：对谷歌的挑战与机遇”

da, li

历史性大事件！ChatGPT又有大动作

da, li

ChatGPT使用倡议来袭，支付清算行业该如何应对数据安全挑战？

da, li

ChatGPT：人工智能模型的股市预测奇迹

da, li

ChatGPT闯金融，可能改变这些，你期待吗？

da, li

ChatGPT狂飙！最新版究竟带何神力？10问深度解析你的期待

北京市中关村创业大街国际人才集市开市，你怎么看这场科技与人才的盛宴？

🔥GPT-4震撼登场！大模型新能力让AI‘画图写代码’，必应升级，中文精度炸裂，学术界翻天覆地，金

相关文章

相关文章