ChatGPT：认知智能里程碑？语言新突破，科技与伦理挑战并存

ChatGPT与生活 2年前 (2023) lida

73 0 0

文章主题：ChatGPT, 人工智能, 语言智能, 技术突破

🌟文章提纲改写版🌟🎓洞察20点，深度解析五大领域：总的视角、ChatGPT技术革新历程、国内竞争格局分析、大模型背后的争议与挑战，以及未来展望🌟📝ChatGPT引领潮流，带你探索技术的创新之旅，从整体趋势到具体应用，一文解读其发展脉络🌍🔍国内同行竞相追逐，ChatGPT背后的技术实力如何？深入剖析，揭示行业动态📈🤔围绕大模型的争议，是机遇还是挑战？解析各方观点，洞悉技术伦理的深层思考🤔🚀未来ChatGPT将如何塑造世界？预测趋势，展望科技与社会的交汇点🌈记得关注我们，获取更多专业且深度的文章内容，一起紧跟技术发展的步伐🏃‍♂️

一、总体看法

1. 从人工智能发展角度看，这是认知智能发展的一个重要里程碑，其意义要高于7年前的AlphaGo。

🏆 AlphaGo的胜利在围棋世界里无疑是智慧与科技的巅峰对决，它凭借强大的数据分析和算法实力，颠覆了人们对AI的认知。然而，尽管它创造了奇迹，普及度却相对有限，普通人很难有机会近距离体验它的强大。🔍 人工智能的应用领域远不止于此，它正悄然渗透到我们生活的方方面面，等待着被更多人理解和接纳。

ChatGPT则完全不同，它是在人类三岁小孩就逐步形成的语言智能方面有了重大突破。

🌟曾经的人工智能🔥，在复杂的挑战面前展现超凡实力——数学定理的精准验证与围棋的智勇对决，无人能敌。然而，在看似简单的日常互动中，如流畅对话和常识推理，它却步履维艰，这正是人工智能领域的一大瓶颈，也是至今尚未攻克的硬核难题。

🌟ChatGPT开启新纪元，打破传统束缚，让每个人都能轻松对话。它以卓越的人工智能技术，吸引了大众的目光，成为广大家庭的首选。🔥得益于其易用性和出色的表现，用户数量呈几何级增长，瞬间爆红全球，掀起了一场人机交互的新热潮！🌍

2. ChatGPT不仅仅是聊天，如果把它限制为聊天，那就显著降低了它的价值和意义。

OpenAI根据自己同类产品API的调用分析，除了纯聊天之外，用户还把它用于文本生成、开放域问答、头脑风暴、改写、摘要、分类等。

ChatGPT是对话式AI迈向真正实现的第一步，从互联网层面看，它可以作为信息入口，与搜索引擎相结合；从文案办公方面看，它可以与办公软件相结合，增强人的办公效率；从人机交互角度看，它体现的是一种基于语言的自然交互方式，可以与元宇宙、数字人结合。

🌟💡 一款创新技术，不仅能够赋能智能机器人，成为其智慧核心，还在人机交互领域实现了重大飞跃。就像人类历史上信息革命的关键节点，它在人与机械之间架起了一座崭新的桥梁。🚀💻

3. ChatGPT是近几年技术快速发展和不断更新迭代、多种技术叠加在一起形成质变的产物，是自然语言处理领域近年来研究的结晶。

🌟🚀底层技术大揭秘！Transformer引领潮流，自监督学习赋能，微调与AI对齐相辅相成，这些前沿科技在🔥自然语言处理与认知智能的深度探索中熠熠生辉。从Transformer的革新，到人类反馈强化学习的独特视角，每一环都在为提升AI理解力和精准度添砖加瓦。🚀

但是ChatGPT将这些技术巧妙地结合在一起，有效规避了大模型的未对齐行为，利用了大模型规模带来的智能突现能力，增强了大模型的指令学习能力和用户意图捕获能力，解锁了大模型的泛化能力，这些能力叠加在一起形成了ChatGPT的质变效果。

4. ChatGPT探索了一种使机器获得语言智能的有效技术路线，但这个方向仍然需要在科学和技术上进一步探索。

技术上，其他的技术路线是否可以达到同样效果？

近几年，大模型研究技术架构上出现了同质化趋势，Transformer独步天下，GPT路线占据绝对统治地位，这对未来技术创新并不是好事；

科学上，ChatGPT一类技术体现了技术先行科学滞后的典型特点，为什么大模型有突现能力？对齐之后的泛化能力是如何形成的？语境学习的机制是什么？

这些问题目前都没有明确的答案，科学回答这些问题，显然可以进一步推动技术发展。

5. ChatGPT技术虽然取得了重要进展，但仍然面临诸多挑战。

第一，虽然采用了人类反馈强化学习（RLHF）AI对齐技术，但是生成的内容仍然存在未对齐行为，如不符合常识，存在偏见、歧视等内容，信息真实性有时存疑（即“一本正经地胡说八道”），未来在AI对齐技术上需要进一步研究和突破；

第二，以ChatGPT为代表的大模型技术通常被具有丰富算力和数据资源的企业垄断，且不开源，不利于大模型技术研究和突破；

第三，目前大模型的算力消耗非常庞大，要实现大规模真实场景应用，模型轻量化技术需要进一步探索；

第四，要提升模型的可解释性，要研制相关技术使得ChatGPT为代表的大模型技术可以自我追溯信息源头，增强可信性；

第五，ChatGPT背后还存在很多科学问题未有明确答案，如大模型突现能力是如何形成的？语境学习机制是什么？AI对齐为什么使大模型具有指令泛化能力？这些科学问题的探索将会推动未来技术更好地发展。

二、ChatGPT技术发展

6. GPT-3之前的大模型技术路线和架构是多种多样的，以BERT为代表的Encoder大模型、以GPT为代表的Decoder大模型、以T5为代表的Encoder-Decoder大模型等，但是从GPT-3之后，大模型技术路线趋于单一化。

包括Google的PaLM、LaMDA，Meta AI的Galactica、OPT，Nvidia/Microsoft的Megatron-Turing，AI21 Labs的Jurassic-1，DeepMind的Gopher、Chinchilla，Hugging Face的BLOOM，国内华为的Pangu-a，浪潮的Yuan-1.0等千亿级参数规模的大模型，基本上都是采用GPT-3的Decoder架构，可能是因为训练成本太高，采用其他未验证的架构，试错成本高，跟随GPT-3成功路线进行微创新是最好的选择。

7. GPT-3 2020年3月发布后，国内外研究机构相继快速跟进，上述提到的大模型基本上都是在2021-2022期间研发出来，也就是说从技术路线上总体滞后GPT-3 1-2年时间。

8. GPT-3文本生成结果比之前的模型有大幅度提升，但同时也存在很多问题，如各种偏见、歧视、潜在的滥用等。

鉴于这些问题，大模型研究开始逐步重视AI对齐研究，即使得大模型输出结果与人的意图、价值观等对齐。

一些瞄准通用人工智能的企业，如OpenAI、DeepMind纷纷成立专门的AI Alignment研究团队，招兵买马，将AI Alignment视为通向AGI之路必须要解决的问题。

来自这两个团队研究人员，甚至成立了一家非盈利研究机构：ARC（对齐研究中心）。

9. 基于大模型的对话agents纷纷在2021-2022期间开始研制，包括Google的 LaMDA、DeepMind的Sparrow、Anthropic的Claude等，这些dialogue agents无一例外都进行了AI对齐。

10. RLHF并不是唯一的AI对齐技术，面向language agents的对齐有很多方法、很多策略，需要更多探索。

11. 模型编辑、稀疏模型、半参数检索模型，这些技术，在大模型发展中同样值得深入研究。大模型编码的知识不应该是一成不变的，将知识全部编码到模型链接和神经元中，可能也并不是最优选择。

12. 除了AI对齐和大模型赋能ChatGPT之外，OpenAI在长文档摘要、自然语言描述转为代码等方面也做了很多工作，这些工作同样增强了ChatGPT相应能力。

三、国内同类技术

13. 2020年OpenAI发布1750亿参数的GPT-3之后，国内企业和科研机构，同Google、微软、DeepMind、Meta AI等一样，于2021-2022年间，研制了类似于GPT-3架构的千亿级大模型。

因此，在底层技术上我们不存在任何问题。

14. 但是要实现中国版的ChatGPT，需要在多个方面加强研究，压实工作。

首先，在数据上，我们要使用与GPT-3相当的数据量和计算量训练模型，目前中文缺乏像英文那样的多个开源大规模数据集，各家企业使用的中文数据也很少开源，很多时候数据也未像OpenAI那样进行精细处理以提升质量；

其次，国内在AI对齐研究上需要加强，尤其是在已经预训练的大模型上，要进行对齐，要继续优化和精调大模型；

再次，要充分调动以大模型为代表的新型AI技术的研发活力，鼓励已经研制的大模型向大众公开，接受广大用户检测，同时也要积极培育专攻某一类核心技术（如大模型AI对齐技术）的初创企业，不求短期市场回报。

四、ChatGPT背后大模型技术的争议

15. 大模型的优缺点在业内讨论非常多，也非常激烈，大模型存在伦理问题、环保问题、资源垄断不开源问题等等，这些问题学术界和产业界都在进行研究，寻找技术、策略、机制等方面的解决方案。

16. 个人认为，业内对大模型争议最激烈的地方在于大模型是否是通向AGI之路、是否具备类人理解力、是否具有情绪/意识，这些问题已经不单纯是在自然语言处理领域、人工智能领域讨论了，一些争论已经在哲学层面进行了，包括借助思想实验等。

除此之外，这些问题涉及的AGI、意识等，对它们的定义，本身也没有共识，存在争议。

17. 就大模型是否能像人一样“理解”用户输入的句子以及自身生成的文本这个问题而言，从技术层面看，大模型本质上是根据单词共现概率基于已生成的单词序列预测下一个单词，共现概率或依存关系是大模型从海量文本数据中建模学习而来。

由于大模型的数据都是符号，模型是无法像人一样将意义、概念奠基到符号之外的物理世界，符号系统在语意上是不充分的。

符号系统本身并不能真正理解符号的意义，所有的意义都是被外部观察者或设计者所赋予的，即使将视觉模态加入到大模型中，大模型学到的也只是符号和视觉元素之间的统计关联关系，仍然不能奠基到真实的物理世界。

也就是说，大模型无法做到类人理解。这里涉及到人工智能图灵测试、中文屋思想实验、符号奠基问题等，感兴趣者可以参考《神经机器翻译：基础、原理、实践与进阶》第19章短评“预训练技术争议与符号奠基问题”。

18. 自然语言处理和人工智能领域的研究者在学术论文中或者介绍AI模型时，经常使用拟人化的描述，如“理解”、“学习”等，主要是为了让读者或听众更容易理解模型或算法的原理，并不不代表机器、模型真的像人一样思考、学习、理解。

五、未来趋势

19. ChatGPT类技术其背后体现的，首先是预示着一种深层次的信息革命。

人类发明计算机和互联网之后，获取、存储和使用信息的方式出现了翻天覆地的变化，但最近几十年基本上没有大的变动，主要以搜索引擎为主，呈现的信息通常需要用户进行二次处理或再加工才能满足要求。

ChatGPT呈现的信息则通常可以直接满足用户的需求，或通过交互方式逐步达到用户的要求，虽然目前还存在信息可靠性问题，但相信未来这些问题会不断得到改善。

其次是人和机器关系会出现重大转变。

以ChatGPT为代表的一类技术在精准捕获用户的真实意图方面迈出了一大步，一旦机器可以“理解”人类意图并完成相应任务，人和机器的交互就不再需要翻译成机器语言，而是直接使用人类语言作为交互载体。

再次是机器生成内容的能力大大增强。

一些文字内容类工作，机器可以辅助人类，人的工作效率会得到极大提升，一些“枯燥乏味”的文字工作则可交给机器完成，人专注于更高层次的内容、思想编辑工作，或通过人机交互方式协同生成更好的内容。

20. 基于以上趋势，未来人类获取信息的方式、与机器交互的方式都会出现变化。

与人类意图、价值观、伦理准则高度对齐的信息智能体会帮助我们高效获取信息、生成信息和发布信息。

以ChatGPT为代表的大模型及其后续更新技术会逐步充当各种机器、设备、机器人的“大脑”，人机之间的交互会更加以人为中心，而不是以机器为中心。

相应的技术会对多个行业、领域产生影响，如教育（规范使用ChatGPT等类型技术，避免学生使用它们做作业，发挥新技术对教育的积极辅助作用，而不是成为作弊利器）、医疗（将大模型技术应用于医疗问答、药物研发、DNA/蛋白质建模等）等，传统的计算机软件，如搜索引擎、办公软件等，也会受到影响和冲击。

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

ChatGPT OpenAI 人工智能办公

版权声明：lida 发表于 2023年3月25日 pm3:39。
转载请注明：ChatGPT：认知智能里程碑？语言新突破，科技与伦理挑战并存 | ChatGPT资源导航

欧洲监管风暴来袭？ChatGPT、Apple与亚马逊AI巨头齐遭调查

da, li

ChatGPTPLUS会员秘籍？超3小时25问限制解锁，买还是代充？

da, li

🔥ChatGPT的背后，AI与碳减排的矛盾？揭秘科技巨头的节能秘密战认识新科技的绿色足迹

da, li

使用ChatGPT打造专业网站？一切就这么简单！

da, li

AI硬件：初创企业的8个失败原因及如何避免？

da, li

为何我选择参考而非采用？人工智能文本的个体差异与鲜活力量缺失的秘密

da, li

ChatGPT：认知智能里程碑？语言新突破，科技与伦理挑战并存

ChatGPT何以引领聊天机器人新时代？🔥打破界限，连贯对话，它能做什么？🌍且听ChatGPT如何

ChatGPT：是普通人的机会还是替代品？

相关文章

相关文章