ChatGPT：知识超结晶体？如何最大化它的作用？

学会提问 2年前 (2023) lida

93 0 0

文章主题：

一、ChatGPT 是什么

ChatGPT 是由 OpenAI 开发的一种基于语言模型的人工智能程序，它可以与人类进行自然语言交互。基于 GPT（Generative Pre-trained Transformer）技术构建。GPT 代表“生成式预训练”，它是一种基于深度学习的自然语言处理技术，利用海量的语言数据进行预训练，从而能够在多个自然语言任务上表现出色。

1.1、ChatGPT如何使用？

🌟ChatGPT的强大无需多言，它集成了众多功能于一身，无论是基础的问答交互、轻松的日常闲聊，还是深度的教学辅导和创新的科研探索，都能游刃有余。💡它的代码生成与分析能力更是令人惊叹，无论是快速编写代码，还是细致检查Bug，ChatGPT都能提供高效且精准的支持。🛠️对于开发者来说，它几乎可以替代一部分编程任务，提升工作效率。只需轻轻一聊，就能开启无限可能！🌐

🌟ChatGPT，人类智慧的结晶🌟，它以无与伦比的知识整合能力，让你轻松触及任何领域的深度知识。只需提问，它会迅速整理简化，提供精准的答案，省时又高效。相比手动在搜索引擎大海捞针，ChatGPT的优势显而易见。如何最大限度发挥它的力量呢？这里有几点小建议💡：1. **明确目标**：清楚你想要什么信息，这样ChatGPT能更精确地为你服务。2. **提问简洁**：避免冗长问题，ChatGPT处理起来更快。3. **深度探索**：对于复杂主题，多问几个相关问题，它会带你深入理解。4. **验证信息**：利用ChatGPT作为参考，但别完全依赖，还需自己核实。拥抱ChatGPT，开启知识探索的新篇章！📚✨

🌟ChatGPT的核心在于提问的艺术，没错，高质量的问题远超千篇一律的答案。💡模型运行依赖于精准的引导——提示就像是导航灯，照亮了生成过程的方向。🎯为了激发深度思考与准确回应，关键在于设计巧妙、富有洞察力的问题。🤔那么，如何让ChatGPT给出最棒的答案呢？试试这些策略：1️⃣ 确保问题清晰明了，避免模糊不清的表述。2️⃣ 提出开放式问题，鼓励生成多角度答案。3️⃣ 避免过于常见或直接的问题，让模型有挑战性。4️⃣ 用具体情境引导，让问题更具针对性。5️⃣ 给予足够的上下文信息，让GPT能理解你的需求。记住，每一次提问都是与AI的深度对话，用心去问，才能收获最优质的答案！🤔📚

1）、增加细节（增加提示的细节和要求）

2）、不断追问（基于ChatGPT生成的内容不断追问）

3）、心存疑问（对于ChatGPT的回答不能盲目相信）

1.2、ChatGPT 是万能的吗？

🌟当然，ChatGPT并非无所不能，它基于深度学习模型的自动推理提供回答，存在一定的可信度挑战。🔍由于神经网络庞大，参数数量达到亿、百亿甚至千亿级别，我们确实无法确定哪些具体参数在驱动其决策，也因此难以评估其答案的精确性。💡这就导致了ChatGPT自身的一些局限性，用户需要谨慎对待它给出的信息。尽管如此，它作为一种强大的工具，仍能提供不少帮助和灵感。但它不能替代专业知识或严谨验证的过程。📝对于依赖准确信息的领域，比如学术研究、法律咨询等，切勿完全信赖ChatGPT的答案。记住，每个AI都有其边界，使用时务必保持批判性思维。🤔SEO优化词汇：ChatGPT局限性、深度学习可信度、神经网络参数精确性、工具辅助理解、专业领域验证、批判性思维。

1）、中文训练语料库比英文训练语料库要少，所以中文知识也少

🌟改写版：作为文章创作领域的专家，ChatGPT虽具备学习能力，但它在信息来源的透明度上有所欠缺。与百度和Google相比，用户在搜索时能明确作者身份，而ChatGPT受限于数据隐私保护，无法直接提供这些细节。它的知识库基于训练，而非直接源自权威源头。

3）、无法获取最新的数据，只能获取训练时间节点的数据来提供知识

🌟当然，ChatGPT的提升空间无限大！持续学习中，它将逐步优化答案质量，但错误风险始终伴随，就像知识探索的路上难免遇到歧途。🚀随着技术迭代，我们期待看到更精准、全面的回答，而SEO优化的词汇将助力其在搜索引擎中脱颖而出。🎓尽管如此，用户还需保持批判性思维，以确保获得最准确的信息。

当一个人一本正经说的时候，我们很容易就觉得他是在说真话，如果他说了很多真话之后，偶尔说几句假话，就非常具有欺骗性了，这就是ChatGPT的问题，所以大家在使用ChatGPT的时候一定要有批判性思维，不能盲从，必须要对答案进行验证。

1.3、ChatGPT 的底层原理

我们可以让ChatGPT自己来回答一下这个问题吧，目前来看最新的GPT模型回答还算比较准确。

我们都知道两个非常经典的深度学习模型，一个是RNN，一个是LSTM，循环神经网络，长短时记忆网络主要用于处理序列类型数据的经典模型，而ChatGPT是基于比这两个模型更新的Transformer架构。

二、预训练大语言模型的发展

2.1、Transformer 架构出现之前

在Transformer架构和与训练大模型出现之前，NLP历史上已经有很多思潮的涌现和发展了，深度学习在NLP领域的突破其实是比较晚的，最早深度学习的突破都集中在计算机视觉领域。

从2012年开始，AlexNet模型在ImageNet图像识别大赛中，取得了很大的突破，这个标志着CNN卷积神经网络的兴起，后来有GoogleNet、VGG ResNet各种深度学习模型的出现，大幅度的提升了图像分类，目标检测、语义分割等CV任务的准确性，在目标检测人脸识别有R-CNN、Fast R-CNN、YOLO SSD一系列算法；语义分割方面也有SENet UNet，再加上生成对抗网络GAN的出现，然后DCGAN、PsychoGAN这种图像生成、风格迁移领域都取得了非常显著的进展。

所以，在2018年以前，CV的发展是风生水起，在NLP领域，虽然有RNN和LSTM，但是并没有特别多的真正落地应用的突破性进展。

是什么带来了NLP领域第一轮的飞跃呢？到了2018年之后，两个核心技术就产生了，一个就是Transformer，另外一个就是BERT，随着这两个模型的诞生，NLP的节奏逐渐就追上来了，紧接着一系列的与训练大模型像雨后春笋个般的出现了，我们就可以下载这些与训练大模型，然后通过微调，在自己的自然语言处理任务上去使用它们，这里的自然语言处理任务就是我们实际的问题，比如语音识别、文本分类、情感分类、命名实体识别、机器翻译、文本摘要、文本生成等。

2.2、用深度神经网络解决 NLP 问题

深度神经网络是怎么解决这种自然语言处理实际问题的呢，深度神经网路其实是由很多层组成的，每一层都有很多神经元，也就是节点，每个节点都有一系列参数，数据输入模型的时候，这些节点就通过这些参数对自然语言处理的数据进行运算，其实从输入空间到输出空间都有对应的函数和一个映射。

比如我们要做微博的情感分类任务，每条微博200字，我们就需要把200字转化为200个token输入进去，那输入序列就是200维，然后经过神经网络所代表的函数、经过参数的计算，最后给你输出一个二维的结果，比如0或者1，0就代表博主的情绪比较负面，1代表博主的情绪是正面的，这就是一个典型的NLP分类任务。

其实整个机器学习就是把它抽象出来变成一个函数的形式，我们去理解深度神经网络也不会那么复杂。

2.3、大型预训练网络 Before 2021

从早起的预训练网络ELMo开始到2021年左右，这个时期的预训练网络发展历程，可以看到预训练网络越来越大，从初代的GPT、初代的BERT到后面的RoBERTTa、BART、T5一个清晰的趋势就是模型变得越来越大，参数越来越多，它所训练的语料库也就越来越大。

比如BERT就是基于Wikidata来训练的，后面的模型就又收录了更多的公开的书籍、网络上的一些文本、语料变得越来越庞大，它的知识库也就越来越大，这是一个很典型的趋势。

2.4、大型预训练网络 As of Dec 2022

截止到2022年12月，此刻的预训练大模型就已经非常庞大了，ChatGPT所基于的GPT-3模型，它有1750亿个参数，在整个大语言模型的生态中，它还不算事最大的模型，但它的效果可能超过其它更大的模型。

2.5、Transformer 架构

Transformer架构是所有预训练语言模型的基础，它是自然语言处理的神经网络，当然，Transformer架构现在已经延展到了CV和其它领域，很多处理自然语言处理之外的问题，也都采取了Transformer架构来解决。

它最早是由Google在 2017 年提出，它的目的就是解决传统训练模型，就是循环神经网络中存在的效率问题和并行计算问题。因为Transformer模型使用了自注意力机制（self-attention）来捕捉输入序列的上下文关系，所以它就使得每个词都能够建立和整个序列其它词之间的连接，从而它就可以有效的捕捉文本中的长距离依赖关系，它不需要像RNN这样来循环的一直去用递归的方式回访过去的数据，所以它跟传统的神经网络相比，它快，它不需要一个词接一个词地处理，它是做整体的并行处理，所以它在训练速度和上下文捕捉这种性能方面的表现都更加优秀。

另外一点就是，Transformer架构它还可以通过堆叠多个层来构建深度学习模型，所以它也是一种深度学习模型，它能够堆叠，所以它就能够不断的来扩大规模，进一步提高模型的性能，现在最新的研究表示，模型越大，它就越有可能出现更多的涌现能力（不知道什么能力就突然被解锁了），就好比今天这个模型还不能对话，随着模型的参数越来越大，层数越来越多的时候，它突然可能就拥有了和你流畅对话的能力，这是一个很不可思议的事情。

所以，现在Transformer模型在NLP任务中已经全面取代了RNN为代表的循环神经网络模型，循环神经网络模型在实际的应用中，以后就不多了。

2.6、Seq2Seq：序列到序列

Transformer本身是一种序列到序列的架构，在Seq2Seq架构中，输入的序列会被深度神经网络处理产生一个输出的文本序列，比如机器翻译、聊天机器人就是很典型的场景。

序列到序列有两个结构，一个是编码器，一个是解码器，其中编码器负责将输入序列编码成一个固定长度的向量表示，然后解码器需要负责把这个向量再生成对应的输出序列，在一个ChatBox中，输入序列通常就是用户的提问，输出序列就是ChatBox的回答或者响应了，这其实就是一个把编码给逐渐解码，然后形成我们最后所需要的答案的一个过程。

当我们训练的时候就会给它一些语料，一个问题的答案应该是怎么样的，它看到这些就自己不断的纠错，然后神经网络就会给出越来越接近我们期望的答案。

2.7、BERT vs GPT

两个最经典的基于Transformer的预训练模型，Google的BERT模型和OpenAI的GPT-3

BERT

1）、Bidirectional Encoder Representations from Transformers

——双向编码，同时考虑了左右两边的词

2）、Masked Language Model（MLM）——擅长做完形填空

3）、Next Sentence Prediction（NSP）——是不是下一句

4）、Fine-tuning ——微调完成下游任务

BERT只需要编码器的内容，不需要生成文本。

GPT-3

1）、Generative Pre- trained Transformer 生成式

2）、Autoregressive 自回归

3）、Prompt/Instruction 基于提示/指令，完成下游任务

BERT和GPT两个模型没有优劣而言，它是针对不同的任务类型设计的，BERT比较擅长于掌控全局，它就能够做很好的自然语言推理任务，比如情感分类、完形填空、命名实体识别、关系抽取这些都依赖优秀的全文理解能力；而GPT它的目标就是文本生成，所以对于聊天机器人或者问答系统来说，它就有比较天然的优势了。

2.8、从 GPT 到 ChatGPT 的演变

GPT是OpenAI的序列生成模型系列，能够产生高质量的自然语言文本。从GPT-1到GPT-3，它的原理其实是很类似的，但是它的参数数量每次都是翻很多倍的增长，GPT-2到GPT-3，参数翻了100倍，输入数据维度也翻了接近8倍，可以使它一次性理解很多很多的token，也就是一次性输入很大的文本都可以同时理解。

到了GPT-3的时候，已经能够生成非常流畅、准确的自然语言文本了，它生成的文本质量基本能够跟人类的写作相媲美，参数数量增加的好处就是让它能够更好的学习自然语言的规律，能够理解序列中更多的上下文信息，生成更连贯更准确的文本，GPT-3还增加了多语言的支持，能够处理更复杂的任务。

ChatGPT是怎么从GPT-3模型的基础上再进一步演进的呢？因为它是GPT-3模型上转么负责聊天机器人任务上的应用，它是GPT-3.5，叫做3.5优化版，它作为GPT的第三代，在万亿词汇量通用文字数据集上面训练完成的。

它还有另一个兄弟模型，叫InstructGPT，都是建立在GPT-3.5基础上，为了让ChatGPT表现出色，OpenAI对预训练数据集还做了微调，给它增加了基于人类反馈的强化学习，让它更能够了解人类想听什么，能够更好的处理哪些是人类想要的答案。

ChatGPT在InstructGPT基础上又增加了一层Stafety Layer，因为它是一个面向大众的聊天工具，它不能说错话，不能够说危害公众安全的回复，不可以宣传不应该宣传的东西，这个很重要，要控制它的回答是合理的。

三、ChatGPT 的训练过程

ChatGPT系列模型的基本思路是让AI在通用的数据上学习文字接龙，掌握生成后续文本的能力，这样的训练有一个好处，就是它不需要人类去标注，只需要把一大堆的语料库输给它，它就会自己去训练，然后你可以给它打分，遮住下文让它去预测。

一个问题可能有很多个答案，作为一个聊天对话机器人来说，我们想得到比较确定性的答案，GPT在进行文本生成的时候，需要进行一些人类的指导，让人类告诉它，什么样的回答才是我最想听到的，这就是基于人类反馈的训练的核心思路。它的RLHF训练过程主要有三步：

3.1、监督调优模型

收集演示数据，用监督学习去训练生成规则（把一些问题写出答案，把问题和答案都丢给GPT去训练，这个是有监督的训练，已经有答案了，让AI一葫芦画瓢，这种方法可以引导AI往人类所期望的方向去做答）

但是，我们不可能人工穷举出所有可能的问题和答案，这个显然是不现实的，所以OpenAI只是提供了可能几万个这种有答案的数据，主要是为了让它在这个基础上进行泛化，然后提供一个方向上的引导，就是告诉模型，你就往这个方向上去答。

3.2、训练回报模型

让简化版的GPT监督训练之后变得更强，通过人工标注所有输出的优劣势

先让ChatGPT输出很多个答案，然后基于它所生成的答案给他排序，我们只需要人工标注哪个答案是最好的，所以OpenAI做了大量的这种标注，

3.3、使用 PPO 模型微调 SFT 模型

通过PPO强化学习算法，实现模型的自我优化，强化学习就是让AI在不断的试错过程中自我调整优化策略，然后最大化预期的长期奖励，简单来说，就是让AI自己去不断尝试，前两步学习的模型在强化学习这一步都能派上用场。

首先用监督版学习的ChatGPT来初始化PPO模型，让Reward模型去指导它，去给回答一个评分，然后AI就基于这个评分去调整自己的参数，试图在下一个回答中得到更高的分数，不断的重复这个过程，这个幼儿版的ChatGPT就成熟起来了，能够自我更新了。

经历这样的三个步骤，一个真正的ChatGPT就训练好了，就能形成我们人类更期待的回答。

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

ChatGPT OpenAI 人工智能写作

版权声明：lida 发表于 2023年7月9日 pm11:58。
转载请注明：ChatGPT：知识超结晶体？如何最大化它的作用？ | ChatGPT资源导航

ChatGPT爆假案，机器人‘胡说八道’真实媒体成新挑战？

da, li

ChatGPT+MindShow：如何高效打造专业PPT？

da, li

《华为“难题揭榜”颁奖典礼：任正非演讲全文及思考》

da, li

ChatGPT替代润色？不！学术领域还需专业把关

da, li

衣时代新机遇？揭秘【知衣】的专利级大数据科技

da, li

行业自律刻不容缓？科技创新应如何避免‘试错’成本与伦理挑战？

da, li

ChatGPT：知识超结晶体？如何最大化它的作用？

一、ChatGPT 是什么

1.1、ChatGPT如何使用？

1.2、ChatGPT 是万能的吗？

1.3、ChatGPT 的底层原理

二、预训练大语言模型的发展

2.1、Transformer 架构出现之前

2.2、用深度神经网络解决 NLP 问题

2.3、大型预训练网络 Before 2021

2.4、大型预训练网络 As of Dec 2022

2.5、Transformer 架构

2.6、Seq2Seq：序列到序列

2.7、BERT vs GPT

BERT

GPT-3

2.8、从 GPT 到 ChatGPT 的演变

三、ChatGPT 的训练过程

3.1、监督调优模型

3.2、训练回报模型

3.3、使用 PPO 模型微调 SFT 模型

揭秘！身体不适？诊断还是治疗先？”

ChatGPT热度减退，AI产业泡沫风险何在？

相关文章

相关文章