ChatGPT未来科技形态，你期待怎样的奇迹？

学会提问 3年前 (2023) lida

93 0 0

文章主题：

ChatGPT无疑是2023年开年爆款话题！

5天注册用户超100万，月活破亿用时仅2个多月······

ChatGPT的爆火毋庸置疑，投行瑞银集团发布研报称之为“史上增长最快的消费者应用”。根据Sensor Tower数据，TikTok达到1亿用户用了9个月，Instagram则为2年半。此外，Worldof Engineering整理的一份达到全球1亿用户所用时间排名显示，iTunes用了6年半、Twitter用了5年、Meta（Facebook）用了4年半、WhatsApp用了3年半。

好了，聊完这款应用的逆天增长数据，我们来聊一聊ChatGPT到底是什么？从英语字面意思来看，Chat是“聊天”的意思，而GPT就要复杂一些，它指的是Generative Pretrained Transformer 3。

那么，从人工智能的专业角度来说，ChatGPT是一个基于GPT-3（Generative Pretrained Transformer 3）的语言模型，用于处理自然语言问答。GPT-3是由人工智能公司OpenAI开发的一种大型神经网络模型，能够处理自然语言文本。ChatGPT是基于GPT-3模型构建的，能够根据用户输入的问题，生成自然语言的回答。通常，ChatGPT被用于聊天机器人、问答系统和其他自然语言处理应用中。

ChatGPT的原理是什么？

ChatGPT 是基于 GPT-3 模型构建的。GPT 是 Generative Pretrained Transformer（生成预训练变换器）的缩写，它是openAI推出的一种用于处理自然语言文本大型神经网络模型，GPT-3 是它的最新版本。

GPT-3 模型包含大量的语言数据，能够理解语言的语法和语义。当用户输入问题时，ChatGPT 会将问题转换为计算机能够理解的数据，并使用 GPT-3 模型进行处理。GPT-3 模型会根据语言数据，生成一个回答候选集，并从中选择一个最佳回答。最终，ChatGPT 会将生成的回答以自然语言的形式返回给用户。

如此复杂的模型是怎么训练的呢？简单来说是 RLHF（从人类反馈中强化学习），分三步：

1.收集提示信息（prompt）和人工形成的任务示例（demonstration），并用监督学习方法训练模型。

2. 将初始模型用在新的对比数据上，生成多个输出，人工对这些输出进行排序，排序结果用于训练奖励模型。

3.使用PPO（Proximal Policy Optimization）强化学习算法训练奖励模型。

最终ChatGPT能演变成何种科技形式，让我们拭目以待！

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！