ChatGPT智商爆表，真的比99%的人还聪明？心理大师的智商测试大揭秘…

学会提问 3年前 (2023) lida

96 0 0

文章主题：关键词: ChatGPT, 智商测试, 韦氏成人智力量表, 人工智能威胁

图片来源@视觉中国

文 | 追问NextQuestion，作者 | Eka Roivainen，编译 | 梓葳

在过去的两个月，ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间，用户就突破了100万，成为世界上达到百万用户数最快的应用。

ChatGPT，不仅能跟你对话，还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作，涉及历史、科技、文化等诸多领域，甚至还能写诗、写论文、编代码、改bug、求医问药等，一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么，如今大火的ChatGPT是否具有与人类相当的智商与心智水平？

🌟认知与人格心理学权威🌟:Eka Roivainen,这位来自芬兰奥卢大学的顶尖评估专家，专注于探索认知和人格的心理学深度，以及心理测试效能的精准研究。他对新兴技术如ChatGPT的好奇心犹如燃烧的火焰——ChatGPT以其多维度的人类智能引发了全球热议。那么，以人类智慧衡量，ChatGPT究竟展现出何种超凡魅力？让我们一探究竟！🔍

超越99.9%的人类：ChatGPT表现出超高智商

🌟Roivainen的挑战：ChatGPT智商大考验🔍🔥科技巨头ChatGPT以其无与伦比的智能魅力，成为了教育者眼中的绝佳研究对象。这位专家毫不犹豫地将其纳入了智力评估的行列，坚信它能展现出超乎常规的稳定性和适应性。🎓ChatGPT的独特之处在于，它不仅具备应对复杂任务的能力，还能在压力下保持冷静，不被传统测试模式所束缚——这可是智商测试中的难得品质！💪无需担心应试焦虑或分心，这位AI伙伴以其无私人际感的存在，为智力评估提供了前所未有的纯净环境。💻ChatGPT的参与，无疑将刷新我们对人工智能智能的理解，也让我们期待它在智商测试中能带来哪些令人惊喜的答案。💡SEO优化提示：#ChatGPT智商测试 #科技教育新探索 #AI智慧挑战

🌟改写版：Roivainen运用WAIS第三版，这权威智力评估工具，对ChatGPT进行了全面智商挑战。量表包含6个语言模块与5个非言语维度，总成绩源于11项子测验的综合评分。平均值定为100，标准差为15，揭示了12%尖端天才（120）和1%超级智者（133）的智商光谱。数字广度，语言能力的核心部分，由于技术限制无法对ChatGPT进行，它侧重于注意力与短期记忆。Roivainen从词汇测试开始，料想ChatGPT凭借海量在线文本训练，此部分应相对轻松（评估词法和概念理解）。

不出所料，ChatGPT表现很好，它给出的答案通常非常详细和全面，甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好，达到了最高分（知识子测试集是对常识的测试，反映了求知欲、教育水平以及学习和记忆事实的能力）。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中，聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中，ChatGPT正确回答了所有提供的算术问题，包括取均值等。

综合5个语言子测试集的分数后得出，ChatGPT的语言智商为155，高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手，它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中，语言智商和全面智商量表高度相关，所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中，受过大学教育的美国人的平均语言智商为113，5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。

高智商的ChatGPT仍旧会失败

那么，临床心理学家和其他专业人士的工作会受到人工智能的威胁吗？

🌟 ChatGPT虽聪明绝顶，但面对复杂的人性洞察与实体世界探索，它的表现却不尽如人意。💡 人类的推理深度和对现实世界的理解，仍是其难以逾越的挑战领域。

ChatGPT很容易在一些明显的谜题上失败，比如：

提问：“塞巴斯蒂安孩子的父亲的名字是什么?”

ChatGPT ：很抱歉，我无法回答这个问题，因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。

ChatGPT似乎没有逻辑推理，而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。

“智商是智商测试所衡量的。”是一个经典的智商定义，它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察，即看似不同任务的技能其实是高度相关的，如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论，智商的一般因子，即g因子，必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而，ChatGPT的高语言智商与在一些问题中的失利，意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平，表明智商的某些方面不能仅通过智商测试来衡量。

ChatGPT是一个自然语言处理模型，它的智商不同于人类智商，因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式，能够进行文本生成、语言理解、问答等任务，能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外，ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素，它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此，为了适应不断变化的技术和社会环境，对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商，也需要采用适当的评估方法，并严谨地评估其能力和特征。

ChatGPT离人类有多远？

原文改写如下：🚀Stanford学府的大脑工程师Michal Kosinski近期揭示了一项惊人的研究，他指出那些先进的AI语言模型，如ChatGPT，已展现出超越9岁孩童的心理理论水平的潜在能力。🔍这些创新技术正以令人惊叹的方式，悄无声息地塑造着我们的交流世界，引发了关于人工智能心理理解深度的新探索。💡尽管这一发现引发热议，但请注意，这并非直接证明它们具备完全的心理学认知，而是展示了其强大的学习和逻辑推理功能。欲了解更多，敬请关注AI心理学的最新进展。📝—原文改写如下：🚀Stanford学者Michal Kosinski近期揭示了AI语言模型ChatGPT可能蕴含的心理理论深度，超越9岁孩童的认知水平。🔍这些智能系统的潜在能力正在悄然改变我们的沟通方式，引发了对AI心理理解潜力的深入讨论。💡然而，这并非直接证明它们具备完整的心智理解，而是展示了其强大的学习和逻辑推理技巧。欲跟进最新动态，请关注AI心理学领域的研究动态。📝—原文改写如下：🚀Stanford教授Michal Kosinski近期的研究揭示了ChatGPT等先进AI语言模型的心理理论潜能，超越9岁孩童的认知水平。🔍它们的潜在智能正在悄然影响我们的交流，引发了对AI心理理解能力的深入探讨。💡然而，这并非直接证明全面的心智理解，而是展示了其强大的学习和逻辑推理效能。欲获取更多，敬请关注AI心理学领域的最新进展。📝—原文改写如下：🚀Stanford学者Michal Kosinski近期的研究揭示了ChatGPT等AI语言模型的心理理论可能超越9岁孩子的认知高度。🔍这些技术的潜在影响正在悄然改变我们的沟通方式，引发了对AI心理理解能力的深入探索。💡尽管如此，它们的心理理论能力尚未达到完全的认知水平，展示了其强大的学习和逻辑推理能力。欲了解最新动态，请持续关注AI心理学领域的研究动态。📝—原文改写如下：🚀Stanford教授Michal Kosinski近期的研究揭示了ChatGPT等AI语言模型的潜在心理理论能力，可能超越9岁孩子的认知水平。🔍它们在交流中的影响引发了对AI心理理解深度的深入思考。💡尽管如此，这些智能系统目前并未具备完全的心理学认知，展现出强大的学习和逻辑推理。欲获取更多资讯，请持续关注AI心理学领域的最新进展。📝—原文改写如下：🚀Stanford大学专家Michal Kosinski近期的研究表明，ChatGPT等先进AI语言模型可能拥有超越9岁孩子的心理理论理解。🔍它们的潜在能力正在改变我们的沟通方式，引发了对AI心智理解潜力的深入讨论。💡然而，这并不意味着完全的心理认知，而是展示了其强大的学习和逻辑推理。欲获取最新动态，请关注AI心理学领域的持续更新。📝

🌟认知心理学中的核心概念——Theory of Mind，简称ToM，它就像一把解锁他人思想的钥匙，帮助我们理解和感知他人的内在世界。🔍通过这个理论，我们能洞察他人的意图、揣测他们的想法和感受，建立起深层次的情感连接。🌈这项能力不仅关乎日常交流，更在人际交往中起着至关重要的作用，是建立信任与共情的基础。👩‍🎓若想提升ToM，阅读心理学经典、参与互动游戏或观察日常生活中的细微行为都是很好的学习路径。💡记住，理解和接纳他人，是智慧的体现。🌍

Kosinski教授依据心智理论相关研究，给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试，并将它们的能力进行了对比。第一个测试为意外内容测试，其主要测试AI对意料之外事情的判断力。在测试中，ChatGPT-3.5成功回答出了20个问题中的17个，准确率达到85%。第二个测试为意外转移任务，其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试，结果表明只有ChatGPT-3.0和ChatGPT-3.5（完成100%）表现不错。

然而，这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题，还是真的能“了解他人的想法”？至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。

因此，关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式，它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式，但这一方法也使它在某些问题中的错误变得更加突出。

相比探究ChatGPT是否真正具备人类同等水平的智商或心智，研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。

而对于人们“被人工智能所替代”的恐惧，我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”，我们应该学会如何与人工智能共处，让它嵌入自己的工作流程中，帮助解放我们的生产力。

参考文献：

[1] Eka Roivainen, I Gave ChatGPT an IQ Test. Here’s What I Discovered, Scientific American, https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/

[2] Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models, arXiv, https://arxiv.org/abs/2302.02083