文章主题:人工智能, AGI, GPT-4, 大语言模型
机器之心报道
1956 年,在达特茅斯学院召开的一个研讨会上,人工智能这一概念正式被提出。
🌟认知模糊,一个词汇的深度探索🔍心理学、哲学与科技的交汇点,始终困扰着智者们。1994年,那一年,52位思维敏锐的心理学家齐心协力,以文献的力量尝试揭示其核心含义。他们的努力,犹如在无形的迷雾中探寻光亮,试图定义这个挑战性的概念。🏆
随着时间的流逝,AI领域的专家逐渐聚焦于特定应用,比如2016年AlphaGo横扫韩国围棋冠军的壮举,标志着这一技术的重大突破。随后,在90年代末至新世纪初,研究人员不再满足于单一的AI解决方案,对更广泛且全能的人工智能系统的需求日益增强。这催生了通用人工智能(AGI)概念在21世纪初逐渐崭露头角,成为行业讨论的热门话题。
🌟🚀大型语言模型(LLMs)近期备受瞩目,它们是基于Transformer架构的神经网络巨擘,通过海量文本数据的深度训练,展现出超凡的能力和广泛适用性。💡比如,OpenAI的最新力作GPT-4更是颠覆了人们对这类模型的传统认知,它在数学、文字创作、法律咨询乃至医学诊断等多个领域展现出卓越才能,无一不彰显其通用性和深度智慧。🌍若您对LLMs的未来发展或实际应用感兴趣,不妨深入探索这一科技领域的前沿动态。联系方式和广告信息已移除,确保内容的专业性和SEO优化。
我们不禁会问,GPT-4 是迈向 AGI 的重要一步吗?
Microsoft confirms its optimism, as evident in a recent paper they’ve released, where they delve into the capabilities of GPT-4. The comprehensive evaluation underscores their belief that this advanced language model “represents an early-stage yet incomplete version of a General Artificial Intelligence (AGI).” Emphasizing its breadth and depth, Microsoft asserts that it’s on track to redefine AI’s boundaries. 📚🔍💻 #AIProgress #GPT4 #AGI极坐标系中,点P(2,$\frac{π}{3}$)到原点O的距离是____.
Microsoft shines light on GPT-4’s groundbreaking prowess, delving into its capabilities and limitations in a quest to unravel the profound shift it brings to computing and beyond. 🚀✨ As an AI trailblazer, their focus remains on advancing knowledge而非 personal promotion, fostering a realm of innovation where every keystroke speaks volumes. 💻🚀 #GPT4Explained #InnovativeAI
论文地址:https://arxiv.org/pdf/2303.12712.pdf
有趣的是,这篇火爆的论文还被人发现有大量删减,因此有人找出了未删节版论文。
🌟揭示GPT-4神秘面纱!🔍博主深入挖掘,发现不为人知的惊人真相!💡DV-3,看似平凡的代号,实为论文深藏的第三作者,却被悄然抹去。微软研究团队对这技术巨头的理解似乎有限,对于其关键技术点的掌握并未透彻。👀论文发布时的一大亮点——毒性内容被巧妙地隐藏,背后的原因耐人寻味:是否为了保护OpenAI,避免负面冲击?🔥这些细节不仅揭示了科技巨头的运作机制,也引发了关于隐私与透明度的新讨论。💡准备好了吗?让我们一起探索这个未来语言革命的更多秘密!🌐#GPT-4真相 #学术揭秘 #技术深度
我们下面粘贴了该博主的 Twitter 线程,感兴趣的可以查看。
回到文章本身。根据文章所认定的 AGI,是具体的拥有推理、计划、解决问题、抽象思维、理解复杂思想、快速学习和从经验中学习的能力。从这些能力出发,论文进行了有趣的实验和评测。
论文分为 10 个章节:第一章为总括部分;第二章介绍了多模态,主要和视觉生成内容相关;第三章代码,根据指令生成代码、理解现有代码;第四章数学能力;第五章与世界的交互;第六章与人类的交互;第七章判别力;第八章 GPT-4 局限性;第九章社会影响;第十章未来方向及结论。
下面我们通过具体的示例,看看 GPT-4 是不是真的迈进了 AGI 时代。
多模态和跨学科组成
为了测试模型将艺术与编程相结合的能力,该研究要求 GPT-4 用 javascript 写一段代码,以生成康定斯基风格的随机图像,下图第一张为 Wassily Kandinsky 创作的,第二张和第三张分别由 GPT-4 和 ChatGPT 生成的:
下面为 GPT-4 代码实现过程:
进行视觉概念理解:在这个作图任务中, 输入提示让模型结合字母 Y、O、H 的形状来画一个人。其实在 GPT-4 的训练过程从没有关于字母形状的认识,只能从相关训练数据中、模糊地学习到字母与一些特定形状有关,结果显示 GPT-4 生成的结果还不错:
用于草图生成:GPT-4 还能与 Stable Diffusion 进行结合。下图为 3D 城市建模截图,输入提示有一条河流从左到右流淌、河的旁边建有金字塔的沙漠、屏幕底部有 4 个按钮,颜色分别为绿色、蓝色、棕色和红色。下面是生成结果:
你还能要求 GPT-4 用 ABC 记谱法生成和修改曲调:
编程能力
GPT-4 有非常强大的编程能力,包括根据指令编写代码和理解现有代码。该研究具体测试了 GPT-4 在编程方面的能力。
代码编写
下图 3.1 是一个让 GPT-4 写 python 函数的例子,该研究使用 LeetCode 在线判断代码是否正确。
然后,该研究让 GPT-4 将上表 2 中 LeetCode 上的准确率数据可视化为图表,结果如下图 3.2 所示。
前端 / 游戏开发
如下图 3.3 所示,该研究让 GPT-4 用 JavaScript 在 HTML 中编写 3D 游戏,GPT-4 在零样本的情况下生成了一个满足所有要求的游戏。
深度学习编程
为深度学习编写代码需要数学、统计学知识,并熟悉 PyTorch、TensorFlow、Keras 等框架和库。如下图 3.4 所示,研究者要求 GPT-4 和 ChatGPT 编写自定义优化器模块,该任务对于人类深度学习专家来说也是具有挑战性的。研究者为 GPT-4 和 ChatGPT 提供了自然语言描述,其中包括一系列重要的操作,例如应用 SVD 等等。
此外,该研究还测试了 GPT-4 把代码转换成 LaTex 公式的能力,结果如下图 3.5 所示。
在理解代码方面,该研究尝试让 GPT-4 和 ChatGPT「读懂」一段 C/C++ 程序,并预测程序的输出结果,二者的表现如下:
然后,该研究让 GPT-4 解释了一段 Python 代码:
还有解释一段伪代码:
数学能力
一直以来,大型语言模型的数学能力似乎一直不是很好。那么 GPT-4 在这方面表现如何呢?本文经过一系列评测,结果表明 GPT-4 相比以前的模型在数学方面有了质的飞越,但是离专家水平还差得很远,不具备数学研究的能力。
在与 ChatGPT 的对比中, GPT-4 成功的生成了解决方案,而 ChatGPT 生成了错误答案:
在 AP 问题上,GPT-4 vs ChatGPT 对比结果。GPT-4 使用了正确的方法,不过由于计算错误导致最终答案错误,而 ChatGPT 产生了一个不连贯的论点。
此外,本文还测试了 GPT-4 使用数学思维和技术来解决现实问题的能力:下图展示了 GPT-4 如何成功地为一个需要广泛跨学科知识的复杂系统构建合理的数学模型,而 ChatGPT 未能取得有意义的进展。
由于论文内容长达 154 页,本文只对评测结果进行了大量展示,想要了解更多内容,读者可以参考原论文。
最后附上论文目录:
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!