ChatGPT：通用人工智能的核心技术？

ChatGPT与PPT 2年前 (2023) lida

85 0 0

打开凤凰新闻，查看更多高清图片

在昨晚的复旦科创先锋论坛上，复旦大学计算机学院教授、博士生导师黄萱菁形容自己和通用人工智能的相遇让她感到“无比兴奋”，这也是她从事人工智能研究这么多年以来最激动人心的时刻。作为国内最早从事人工智能、自然语言处理和信息检索的学者之一，她判断AI可能会像工业革命和信息革命一样，引领我们走向下一个时代。ChatGPT的出现让她更加坚信这一判断。作为全球领先的人工智能平台之一，ChatGPT不仅让人类语言处理能力得到了大幅提升，还实现了对大量文本数据的高效处理和检索。这一成果不仅在国内引起了轰动，也在国际上引起了广泛的关注和讨论。黄萱菁教授认为，ChatGPT的出现证明了AI技术已经取得了长足的进步和突破，这一技术的应用前景也极为广阔。她相信，随着技术的不断深入研究和发展，未来我们还会看到更多令人兴奋的AI技术和应用。

在活动现场，黄萱菁发表了主题为“迈向大规模语言模型”的演讲。她解释了语言模型的定义，指出语言模型就是语言的规律。虽然仅仅通过语法学习，我们很难捕捉到客观世界纷繁复杂的语言现象，因为语言并不会严格按照语法去表达。因此，我们需要使用数学“武器”——概率，在各种语言现象中间去寻找规律。通过对句子进行概率分析，我们就能知道什么是正确的识别结果。这个概率模型就称为语言模型。

传统概率语言模型需要大量计算资源来处理海量句子，因此在许多情况下无法有效地训练模型。为了解决这个问题，2017年出现了一种名为Transformer的模型，它能够通过压缩句子和单词序列的方式来减少计算量，并且能够使用更长的时间窗口来训练模型。Transformer模型成为现在预训练模型的基石，也是大规模语言模型的基石。

据黄萱菁介绍，传统的预训练模型有两种思路。一种是理解模型，比如BERT，另一种是产生式模型，比如ChatGPT的前身GPT。也有工作尝试将理解模型和产生式模型结合起来。曾经，理解式的模型被广泛使用，但产生式模型则需要更高的算力和更长的窗口，直到GPT-3的出现，大家才知道它如此强悍。ChatGPT还拥有很强的理解人类上下文的能力。

我们生活在一个快速变化的时代，每个礼拜都有新的模型发布，新的预训练和微调方法也随之出现。在这个时代，大厂商逐渐放弃开源，而用户也缺乏足够的计算资源来使用大模型。因此，一个新的范式出现了：利用大规模语言模型的涌现能力。这种模型虽然参数规模较大，但在未达到临界值时，你无法看到它的强大。但当模型的参数规模达到某个临界值时，它就会变得非常强大，这种强大的表现甚至可以超越那些开源的大模型。

ChatGPT背后的核心技术是大语言模型，该模型可以展现出强大的学习能力。现有研究表明，模型规模和数据量越大，性能越好。当模型和数据规模达到一定程度时，模型将获得涌现能力，表现出更为出色的语言理解和生成性能。

强大的能力后，ChatGPT会给我们带来哪些改变？微软CEO萨提亚·纳德拉曾指出，内燃机带来了廉价的动力，互联网技术减少了信息传递的成本，而ChatGPT会让信息的整合、转译、流通变得更加廉价。

在黄萱菁看来，ChatGPT可以视作是人工智能的基座，就像“大脑”一样，它可以协助人类完成各种任务，提高效率。未来，ChatGPT将协助人类完成更多的工作，但它并不能完全取代人类，因为AI只是工具，而不是人类。

改写后：同时，她表示，“我们发现ChatGPT能力现在的强大性能都是在现有的机器学习框架下可以解释的，并没有一些很玄的东西。我相信今年除了OpenAI，国内外会有很多机构，包括大学和企业等，在ChatGPT模型方面会有大的突破。”

作者：唐玮婕

编辑：朱伟

责任编辑：戎兵

*文汇独家稿件，转载请注明出处。

关键词：ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、复旦大学计算机学院教授、博士生导师、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、信息整合、转译、流通、马丁路德金、微软CEO、纳德拉、内燃机、互联网技术、信息传递、马丁路德金、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用者、计算资源、数据量、性能、效率、生产力、信息整合、转译、流通、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、ChatGPT、大语言模型、涌现能力、理解人类上下文、人工智能、工业革命、信息革命、学术论坛、计算机科学家、自然语言处理、信息检索、学术论坛、计算机科学家、语言模型、语法、概率、大规模语言模型、预训练模型、Transformer、理解式模型、产生式模型、大厂商、开源、下游应用、数据量、性能、效率、生产力、信息整合、马丁路德金、内燃机、互联网技术、信息传递、效率、生产力、信息传递、马丁路德金、效率、生产力、信息传递、马丁路德、马丁