ChatGPT的火爆引发了近几年来一次全
ChatGPT的火爆引发了近几年来一次全球性的技术狂欢。两个月时间内,其月活用户突破1亿,成为史上用户增长最快的应用之一。
埃隆·马斯克在社交媒体推特上使用ChatGPT后,直呼其“好得吓人”,并断言“人工智能越发强大,离对人类产生威胁不远了”。
对大热的ChatGPT,复旦大学计算机学院教授黄萱菁团队也进行了测试。他们让ChatGPT进行了几十万次测试,包括让GPT做中国的高考题,看看它到底有多么强。但结果很出人意料,虽然政史地科目结果很好,但是物理学科一道都没做对。黄萱菁打趣道:“学物理的人最安全”。
3月11日,在“我们—WOMEN”2023复旦科创先锋论坛上,深耕人工智能与自然语言处理领域三十载的黄萱菁教授以《迈向大规模语言模型》为题,为我们讲述了ChatGPT的“前世今生”和最新发展趋势。
迈向大规模语言模型
托ChatGPT的福,大规模语言模型的概念已经深入人心。ChatGPT是由GPT-3.5模型提供支持的人工智能技术驱动的自然语言处理工具。它不仅能够自动回答问题、生成文本、翻译文章、对信息分类、撰写脚本文案、代码等,还可以承认错误、质疑不正确的前提并拒绝不恰当的请求。因此,可以说ChatGPT是AIGC(人工智能生成内容)最新进展的代表。
语言模型是语言的规律,包括语法和概率。无论学习汉语还是英语等语言,我们都需要从语法开始学起。但是,只有语法并不能解决所有问题,因为语言并不能完全按照语法去表达。这时,我们需要使用数学工具——概率,在各种语言现象之间去寻找规律。
以Transformer为架构的大型语言模型机器学习系统,采用的神经网络学习能力和模型的参数规模成正相关。GPT-2大约由15亿个参数组成,而GPT-3是一个由1750亿个参数组成的最先进的语言模型。黄萱菁介绍,近年来,学术界和工业界开始尝试在自然语言处理领域应用神经网络方法,预先训练出大规模的语言模型,并针对具体场景构建特定数据集,供这些大模型在下游任务中通过参数微调以适配具体任务。这种技术被称为“大模型微调”或“大型语言模型预训练”,能够提高自然语言处理任务的效果和效率。
语言模型的更强大,也带来了一些问题。黄萱菁指出,一方面,厂商出于商业原因,逐渐舍弃开源,OPenAI只开放了API接口,用户无法获取GPT3模型的内部细节。今年新出来的ChatGPT连论文都没有,只能靠大家去猜测。另一方面,用户缺乏足够的计算资源来使用大模型,因此我们期待国产芯片的出现,能够让我们拥有更多的算力去运行大规模语言模型。
打开“AI情感计算”之门
2022年12月,埃隆·马斯克发了一条推文,他说:“ChatGPT is scary good. We are not far from dangerously strong AI.(ChatGPT厉害得让人害怕,强大到有危险的人工智能的出现已经离我们不远了。)”在这条推文中,埃隆·马斯克表达了对ChatGPT的赞赏之情,同时也警告人们,如果不采取足够的措施来限制人工智能的发展,那么人工智能可能会带来无法预测的后果。从这条推文可以看出,埃隆·马斯克对人工智能的发展非常关注,并且认识到了人工智能所带来的潜在危险。这也提醒我们,在推动人工智能技术的发展和应用的同时,需要认真思考并评估其潜在的风险和影响。
自从ChatGPT出现以来,人们开始讨论人工智能是否会对他们的生活、工作和工作产生负面影响。尽管ChatGPT能够通过图灵测试,但它仍然只是一个人工智能程序,无法像人类一样思考和决策。
在黄萱菁看来,未来一段时间内,ChatGPT还不足以完全替代某一个岗位,但将大大促进各个领域的生产效率:“在肉眼可见的未来,善用AI的人将和不用AI的人在工作效率上会产生巨大差距,因此我鼓励大家多去使用和熟悉与AI进行沟通。”
ChatGPT的出现将拉近我们与通用人工智能之间的距离。黄萱菁对此感慨,“以前我们从来没有觉得自己与通用人工智能如此接近,这是过去我在人工智能领域这么多年以来最兴奋的一个时期。以前我总是认为通用人工智能是遥不可及的目标,但是现在我认为它可能不是那么遥远了。”
微软CEO萨提亚·纳德拉(Satya Nadella)曾在接受媒体采访时指出,内燃机的推出带来了廉价的动力,互联网技术的普及降低了信息传递的成本,而ChatGPT的出现则会使得信息的整合、转译和流通变得更加廉价。这一观点引起了黄萱菁的关注,她认为AI技术可能会像工业革命和信息革命一样,引领我们走向下一个时代。
关键词:ChatGPT、大规模语言模型、自然语言处理、深度学习、GPT-3.5、语言模型、语法、概率、计算资源、用户、高考、人工智能、图灵测试、马斯克、埃隆·马斯克、社交媒体、推特、马斯克、埃隆·马斯克、技术狂欢、用户增长、技术发展、学术研究、数据集、模型训练、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、廉价、下一个时代、工业革命、信息革命、人工智能、通用人工智能、图灵测试、计算资源、用户、工作效率、人类工作、岗位替代、语言模型、深度学习、神经网络、模型参数、大规模语言模型、自然语言处理、学术研究、技术发展、未来、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、廉价、下一个时代、工业革命、信息革命、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、语言模型、深度学习、神经网络、模型参数、大规模语言模型、自然语言处理、学术研究、技术发展、未来、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、转译、流通、内燃机、互联网技术、信息传递、信息整合、人类、机器、人工智能、工业革命、信息革命、信息传递、信息整合、人类工作、岗位替代、计算资源、用户、效率、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语言模型、语法、概率、计算资源、用户、应用场景、生产效率、信息整合、技术发展、学术研究、自然语言处理、深度学习、神经网络、模型参数、大规模语言模型、语法、概率、计算资源、用户、应用场景、生产效率、技术、学术研究、大规模语言模型、语法、概率、计算资源、用户、效率、技术发展、学术研究、大规模语言模型、概率、计算、应用、应用、应用、学术研究、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用、应用。