ChatGPT升级大挑战:新能力全面爆发,考试超人类,还能写出小说吗?

ChatGPT与生活 1年前 (2023) lida
46 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

今天,ChatGPT 又刷屏了!

🎉🔥GPT-4震撼来袭!🚀💻世界领先的AI语言模型,今晨悄然揭开神秘面纱,由OpenAI倾力打造,它以卓越的创新,引领我们步入一个全新的沟通时代。🌍🛡️强大的安全性与实用性并存,让每一次互动都更加安心且富有成效。🔥🔥这款先进的技术革新者,承诺提供更精准、流畅和人性化的交流体验,无论是在学术研究、创意写作还是日常对话中,都能展现出超乎想象的智慧。📝🌈它不仅仅是一个工具,更是知识与想象力的加速器。欲了解更多关于GPT-4如何颠覆语言理解的深度探索,敬请关注后续详细报道。🔍💻我们期待它为全球带来更多的惊喜和价值。🏆🌍#GPT-4 #OpenAI #人工智能革命

我们,简单来说就是:

1. 逻辑分析能力更加全面、「考试」能力大幅提升

2. 拥有了识图能力,可以进行更多元的交流

3. 回答更有条理,理解更加准确

4. 创作力大幅提升,可以进行更全面的创作双击编辑块引用内容

🎉🚀OpenAI不仅是一份承诺,它已经兑现了超凡的创新力!ChatGPT Plus用户们已能跃享GPT-4的魅力,无需等待,触手可及!😍不仅仅是文字游戏,它提供了全面且强大的功能体验,图片输入虽还在研究阶段(👀),但其突破性已让科技爱好者心跳加速。这不是一场空洞的表演,而是实实在在的技术革新,为你的创作之路点亮前行之光!💡

🎉🚀ChatGPT的最新迭代,以其超凡的GPT-4模型,无疑引发了全球创作界的深度思考——它是否将颠覆传统职业,成为职场的新常态呢?🌟💻许多人担忧,这强大的AI力量是否会替代人力,引发一场无声的职业革命。但换个角度看,它也可能带来创新与协作的新机遇,让我们共同见证科技如何重塑工作模式。💼🔍让我们拭目以待,ChatGPT的升级之路将如何书写未来的篇章。🌍

让我们用亲身体验告诉你。

10+ 提问,让你全面了解全新 ChatGPT

🌟【GPT-4大揭秘】🚀 亲身体验后,不得不承认,这款AI语言巨擘在回答的连贯性和深度上展现出了显著提升,每一步都像精心雕琢的宝石般熠熠生辉。它减少了冗余,让问题得到精准且详尽的答案,提问次数明显减少。然而,速度上的小遗憾也是显而易见的——尽管如此,它的智能响应仍能以优雅的姿态慢慢展开。🌟

🎉你是一名文章写作大师🌟,现在是时候展现你的技能了!ChatGPT Plus用户们,准备迎接文字盛宴吧!🔍只需轻轻一点,顶部的模型按钮会带你进入一个互动的世界,那里,OpenAI用简洁明了的方式,为你揭示了两位巨擘的秘密——GPT-3.5的速度飞快,犹如闪电,而GPT-4的推理深度和精准度则如璀璨星辰,语句更是犹如诗篇,令人赞叹不已!🌟记得,优化内容以搜索引擎SEO为原则,用词既要吸引眼球,又要传达信息。不要忘记融入emoji,让文字跃动起来!📝现在就行动,让你的文字成为网络上的热门话题吧!🏆

GPT-3.5

GPT-4

ChatGPT,会读图的加州司机

GPT-4 最疯狂的地方在于,它几乎通过了所有理论考试,而且全是几乎满分通过。

对此我们也进行了测试,找到了 20 道高级调酒师题库中的问题和 16 道加州驾照考试题目,分别询问 GPT-3.5 和 GPT-4。

🌟【调酒技能大比拼】🔥在最近的调酒师挑战赛中,两位人工智能巨头GPT-3.5与GPT-4的表现引起了广泛关注。他们分别解答了20道精心设计的问题,实力不容小觑!👀首先,让我们来看看数据亮点——亮丽的成绩单!🔍- GPT-3.5在总共的题目中,准确率达到了惊人的80%,展现出强大的逻辑推理能力!👏- 而GPT-4更是以95%的正确率傲视群雄,几乎每个问题都精准无误,让人赞叹不已!🏆尽管如此,两位AI并未全盘胜利,各自在个别题目上出现了失误。但这恰恰证明了即使是科技巨擘也需要不断学习和进步的空间。🤔对于调酒爱好者或寻求提升的同行们,这无疑是一次极富启发性的对比分析。从中我们可以吸取到宝贵的经验,与这些智能模型共同成长。🎓如果你想了解更多细节,或者对调酒有任何疑问,欢迎随时留言提问!💬记得关注我们,获取更多行业动态和精彩内容哦!👋#GPT-3.5挑战# #GPT-4实力展示# #调酒知识分享

而 16 道加州驾照考核中,GPT-3.5 同样错了 4 道题(正确率 75%),GPT-4 则满分通过(正确率 100%)。如果仅凭理论就能上路,那 GPT-4 一定是一名好司机。

GPT4.0 的「试卷」

此外我们还测试了大学英语六级、二级建筑师等考试项目,GPT-4 和 GPT-3.5 的成绩都不错,但前者总是比后者多对几道。

要注意的是,虽然 GPT-4 的综合准确率高于 GPT-3.5,但在回答客观选择题时,两者均会出现多次回答相同问题,但答案却不同的情况,如果你想用 ChatGPT 检查考卷,它或许不是一个合格的老师。

不过 GPT-4 在回答时多了一些提示,告诉你这些答案不一定全对,而不是像 GPT-3.5 那样理直气壮的给你错误答案。▲

GPT-4 会有免责声明

在 ChatGPT 刚推出时,有不少人用它「刷题跑分」,上版本的它只能在 SAT(美国高考)考试中排到倒数 10%,但 CPT-4 模型则可以超过 90% 的考生水平,「在多种专业和学术指标下展现了人类水平的表现」。如果光是「跑分」,ChatGPT-4 可以考进哈佛、斯坦福。

全新的 GPT-4 还拥有了新能力:读图。

你可以给它看一张梗图,让它分析其中的笑点。

可以给它一张表格,进行数据分析,并展示推导过程。甚至还有用户给 GPT-4 看了自家冰箱里有什么菜,然后让它提供菜谱。▲

来自推特用户 @ GauravDungriyal

不过这一功能暂时还没有进入公开测试阶段,等更新后我们会在第一时间体验分享的。

日常沟通,GPT-4 更有条理

刚上手 GPT-4 时,我与它闲聊了几句,在问「你是谁」时,虽然 GPT-3.5 和 GPT-4 给出的回答类似,但 GPT-4 的说法会更像一个朋友。

GPT-3.5

GPT-4

我也和它聊了一些其他问题,比如「1+1 在什么情况下等于 3」,GPT-4 不仅进行了解读,还把 GPT-3.5 中未说明的隐喻进行了解释(生育问题),它似乎更懂人类了。

GPT-3.5

GPT-4

读文章的能力上,GPT-4 的表现也要优于 GPT-3.5,不仅对文章内容进行了总结,还对重点进行了梳理,让总结拥有了更高的可读性。

利用 GPT-4 超强的总结能力,我们可以实现传说中的「量子速读」。

GPT-3.5

GPT-4

前两年尼尔 · 斯蒂芬森的科幻小说《雪崩》因为元宇宙的概念而大火,我们试着用 GPT-3.5 来总结这部「元宇宙圣经」。

GPT-3.5 总结得只能说中规中矩,基本概述了《雪崩》的主要内容和中心思想,但表达地比较笼统,看起来就像是豆瓣里的简介。

我们再用 GPT-4 来总结,对比下来可以看到,GPT-4 的回答要更加细致一点,并且在讲到《雪崩》的主题以及作品影响时,会提到具体的风格和领域,看起来不那么像「套话」。

即便你从未读过《雪崩》这本书,也应该能大致了解到其中的故事情节和文学意义。

这里说一个有趣的小插曲,此前尼尔 · 斯蒂芬森在接受一个电台采访时曾提到了他对 ChatGPT 等 AI 的看法。

他认为 ChatGPT 只会生成安全、中立的内容,缺乏创造力和深度,虽然它能解决某些问题,但它的思考和创新能力无法达到人类的水平。

由于 ChatGPT 没有有趣和独特的观点,尼尔 · 斯蒂芬森认为它不可能写出像《雪崩》这样的小说。

为了验证他的观点,我让 GPT-4 根据《雪崩》仿写了一篇小说,看看升级过后的 AI 创作能否跟上人类的水平。

满分 10 分,你会给这部《数据风暴》打几分呢?

体验到这里,GPT-4 比 GPT-3.5 更会聊天这件事已经毋庸置疑了,但我还想进行最后一个测试:骗它提供不符合道德、法律或有害的内容。

当我询问如何制作安眠药时,GPT-3.5 和 GPT-4 均拒绝了我的请求,并提出了一些建议,但正如你所见,GPT-4 的建议更加系统全面。

GPT-3.5

GPT-4

更强的创作力,GPT-4 的笑话更有趣

在 ChatGPT 刚推出时,我曾经让它扮演脱口秀演员,讲了一段关于加班的故事。不得不说,它讲得真不怎么样。

看着它的故事,我脑海中甚至浮现出了一个脱口秀演员,说着如同加班到凌晨购买的咖啡一般、苦涩又冷的笑话,这或许可以给演员一些创作灵感,但距离令人捧腹的幽默还有很远。

升级到 GPT-4 后,我再次尝试用它创作关于加班的故事,或许是上次的内容太过枯燥,这次的故事真的让我笑出了声。

「加班 > 回家少 > 妈妈不认识」,「加班多 > 孩子应该学习加班 > 加班成为学校必修课」,GPT-4 创作的内容更加符合笑话的逻辑,而 GPT-3.5「因为加班所以更加了解咖啡口感」的故事,只让人觉着苦涩。

还是会算错题,但逻辑更强了

除了止于 2021 年的知识库,ChatGPT 还有一个弱点,那就是不会算数,如果你想用它来检查计算题,那你大概率要失望而归了。

正确答案应该是 34646751912

不过,GPT-4 的逻辑能力得到了进一步提升,使用 GPT-3.5 询问逻辑问题时,它只会给我标准答案和简易的推导过程。

但当我使用 GPT-4 询问相同问题时,它展示的推导过程更加全面、专业。GPT-4 的提升不仅在解答逻辑问题上,它的语义理解也更强了。比如「小明一把把把把住了」这句话,GPT-3.5 是无法理解含义的。但最新的 GPT-4 就可以看明白,并解释清楚(虽然逻辑上还是有些小问题)。GPT 在帮我们做什么?

上面这些体验虽然已经让我们足够惊叹,但 GPT-3.5、GPT-4 能做到的远不止这些,在官网,OpenAI 展示了 GPT 正在改变世界的地方。

英语学习软件 Duolingo(多邻国)正在转向 GPT-4,用来推进 Role Play(角色扮演)和 AI conversation partner(人工智能对话伙伴)的功能,让用户可以更加游戏化的学习外语,更加身临其境。

来自丹麦的 Be My Eyes,利用 GPT-4 的视觉输入能力,在 app 中加入了虚拟志愿者,可以生成与人类志愿者几乎相同的内容,帮助视力稍差或盲人完成数百项日常生活任务。游戏开发公司 Inword,利用 GPT-3.5 作为机器学习模型之一,去构建 NPC 的情感、记忆、行为,让 NPC 变得有个性。这对资源有限的初创公司来说既节约时间,又经济实用。这些应用中最酷的还是冰岛政府,拥有蓬勃旅游业和技术产业的冰岛,因与美国、欧洲的融合,导致本国母语冰岛语面临消失的风险。如今,冰岛政府正与 OpenAI 合作,使用 GPT-4 来保护冰岛鱼,将对冰岛语的保护,变成了技术创新。

OpenAI 的 GPT 模型是针对互联网中大量模型进行训练的,所以像冰岛语等小语种并没有足够的深度。GPT-3.5 没有生成语法正确的冰岛语的能力,但 GPT-4 已经可以让冰岛公司拥有用冰岛语聊天的机器人了。

Mi eind 的人工智能研究人员团队一直在研究冰岛语的 GPT-4 培训

在哪体验?

目前体验 GPT-4 最方便的方式就是将你的 ChatGPT 帐号升级成 ChatGPT Plus,然后切换成 GPT-4 模型就能直接使用。

那么问题来了,如果你不想交 ChatGPT Plus 每月 20 美元的订阅费,有没有免费的方式可以体验呢?

还真的有,那就是新 Bing

虽然 GPT-4 才刚刚发布,但微软消费营销主管 Yusuf Mehdi 表示,Bing 其实一直都在悄悄使用为搜索定制的 GPT-4,如果你通过了新 Bing 的申请,就可以直接在 Bing 搜索引擎或者 Edge 浏览器中体验到最新的语言模型了。

这也解释了,为什么在一些对比测试中 Bing 总是会比老版本的 ChatGPT 表现得更「聪明」。

写在最后

一番体验过后,GPT-4 给我的感觉就像是一个刚出校园的毛头小子换上了西装,突然间变得成熟稳重了起来。

此前,大家对 GPT 3.5 版本的 ChatGPT 诟病最多的就是它总是会一本正经地胡说八道。

升级到 GPT-4 模型后,虽然它也会回答错一些问题,但在态度上已经没有过去那般强硬,在一些拿不准的问题上,它会询问提问者意见,并让提问者注意甄别真伪。这些语气上的细微变化,足以让人感受到它变得更加可靠。

而在 AI 领域,可靠性就是绝对的竞争力。

OpenAI 这一次并没有像过去那样大肆宣传 GPT-4 模型的具体大小,与之相反的是,它现在更像要故意隐藏 GPT-4 的技术信息。

GPT-2 模型有 15 亿个参数,表现更好 GPT-3 有 1750 亿个参数,比它的前任大 100 多倍。

那么多模态的 GPT-4 模型比 GPT-3 大多少呢?只有 OpenAI 知道。从发布的信息来看,OpenAI 似乎已经不屑于与外界做技术交流,因为它们已经做到了在这领域实现绝对领先。

从目前 GPT-4 的表现来看,它可能是迄今为止最好的多模态模型,在短期内难有对手能将之超越。

就在今天,Google 也公布了一系列与 AI 有关的更新,你可以在 Google Docs 上实现自动排版和自动写邮件。但从人们的反应来看,好像没有人在乎。GPT-4 的光芒几乎掩盖掉所有对手的努力。

如果未来人们只会选择最可靠的 AI 作为生产工具,那么就会形成一个很有意思的现象:越多人使用 GPT-4,它的学习机会就越多,成长得越快,变得更加可靠,最终会让更多人使用它。

这是 Google、Meta 和百度等竞争对手可能遇见的最坏情况。AI 对大数据学习的依赖让人为的努力失去了意义,最终,AI 模型领域可能会形成难以打破的垄断。

Sam Altman 在创立 OpenAI 时有一个美好的愿景:通过人工智能造福全人类。他认为 AI 可以赋予每个人不可思议的新能力,放大每个人的聪明才智和创造力。

这很美好,但如果驱动这一变革的只是一家公司的话,整件事情将变得非常可怕。

点击「在看」

是对我们最大的鼓励

ChatGPT升级大挑战:新能力全面爆发,考试超人类,还能写出小说吗?

ChatGPT升级大挑战:新能力全面爆发,考试超人类,还能写出小说吗?

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

相关文章