揭秘ChatGPT背后的秘密？国内如何迎头赶上？大模型、小模型的未来在哪里？京大会谈揭示行业新趋势

ChatGPT与生活 2年前 (2023) lida

76 0 0

文章主题：

🎉🚀ChatGPT的全球火爆，无疑是人工智能领域的又一里程碑！但对于这款背后藏着深奥科技的大模型，我们不禁好奇：它是如何工作的？中国的步伐能否紧随其后？还有那些看似平凡的小模型，它们的命运会怎样呢？🔥🔍探索大模型的秘密，国内创新者正加速追赶，小而美的技术同样值得期待！🌍🏆让我们一起揭开AI的神秘面纱，迎接未来智能的新篇章！🌟

🎉【ChatGPT与大模型盛会在京】🔥 3月21日，一场关于人工智能巨擘的盛宴在北京拉开帷幕——ChatGPT及大模型技术大会！💡来自顶尖学府如北大、清华、人大、哈工大和中国科学院的学术泰斗们，以及华为、贝壳等业界领军人物齐聚一堂，深度剖析国内外大模型的前沿进展与未来趋势。📚从基础研究到实际应用，他们围绕大模型的全链条进行了深入交流，为科技发展注入强大动力。💼这场盛会不仅展示了技术实力，更昭示了创新与合作的力量。💡SEO优化词汇：#ChatGPT大会 #大模型技术 #北京研讨会 #人工智能未来 #产学研结合

揭秘ChatGPT背后的秘密？国内如何迎头赶上？大模型、小模型的未来在哪里？京大会谈揭示行业新趋势

模型一定越大越好？

小模型有机会吗？

🌟💡与会者们热烈探讨著大模型背后的秘密，尤其是GPT那令人惊叹的推理技巧——它如何悄无声息地展现出超凡智慧？这无疑决定了未来大模型研发的关键路径，资源将聚焦于何处以提升其核心效能呢？🔍🧠泛化能力是关键，正是这种无处不在的力量让大模型在各种情境中熠熠生辉，展现卓越的智能。🚀

🌟【顶尖智囊】🌟北京大学光华管理学院AI专家，掌握前沿技术，引领行业趋势。专长于深度学习与大数据分析，为企业智能化转型提供战略指导。曾任国内外知名企业的顾问，实战经验丰富。欲了解更多，点击链接📚️→[高瓴人工智能学院官网](https://example.com/ai)✨

🌟🚀自然语言处理领域的两大演进趋势正在引领未来之路：首先，模型的标准化程度日益提升，就像一场技术的马拉松，速度与质量并重；其次，规模化效应愈发显著，大模型的威力不容小觑，每增加的参数都仿佛为智能插上翅膀。随着计算力的不断提升，这些巨无霸模型展现出的推理能力更是让人惊叹不已，开启了语言理解的新纪元。🌍🧠

🌟对于模型的”尺寸”之争，业界与学术界虽有分歧，但小模型并非无用武之地。💡车万翔专家指出，尽管大模型已成为主流，但在某些特定领域，如细分行业，小模型同样能发挥出色。数据显示，推理能力并非越大越好，针对特定任务，适度规模的模型就能满足需求。📝张家兴的观点也支持这一观点，他认为即使是写作任务，数十亿参数的大模型也能提供与ChatGPT相当的表现。尽管大模型在通用性和创新性上占优，但小模型的定制化和效率同样不容忽视。💡无论是追求高效还是精准，行业选择应灵活看待模型规模，找到最适合自己的”尺寸”。🌍这不仅意味着技术的进步，也是对资源优化和成本控制的有效策略。

华为算法应用部部长王云鹤表示，在例如风控这样的领域，采取小模型可以做的很好，就完全没有必要使用大模型了。如果说ChatGPT是一个“文科生”，那么一些专业模型就是“理科生”，“没有必要强求文科生去干理科生的事情”。

目前大模型参数规模已经进入千亿时代，且仍在继续飙升，这带来算力的极端紧张。中科院自动化所模式识别国家重点实验室研究员李兵认为，在垂直领域，大模型并不经济。最后真正去服务大众，会是一些从大模型变异、抽象后得到的领域专家模型。他们团队在关注如何做模型的轻量化，例如从大模型抽取知识，将其“蒸馏”到小模型上使用。

国内差距有多大？

国产芯片够用吗？

一个问题正在引起国内的焦虑，距离ChatGPT以及GPT4为代表的大模型，我们差距有多大？追赶难不难？

北京大学计算机学院长聘教授李戈在大会上表示，在大模型领域中美差距有一到两年甚至更长。而训练模型的成本极高，“以OpenAI的GPT3为例，当时的一次成功训练使用了1万张V100计算卡，一共做了13天”。并且，这对于外界来说，还仅仅只是看到成功训练一次的成本，还不算那些看不见，训练失败的成本。

在众人关注的“算力卡脖子”问题上，李戈认为，国产计算卡“值得大家去尝试”。不过他也表示，国产卡在推出后也需要配合相应的计算框架。需要承认，国产计算卡在相应的生态方面还与国外有差距。不过他认为，在这方面国内的新生创业公司正在补上缺位。昆仑芯科技研发总监王志鹏说，国内的芯片公司需要承认劣势，但也会有很多机会，国产芯片的优势是更能够深入理解我们国内的真实业务场景。

张家兴则指出一个现实情况：一个超级大模型出现之后，采取跟随战略来制作属于自有类ChatGPT模型的团队，工作都会变得十分简单，因为他们可以利用这个超级大模型生成数据，成本都会变得很低。这样做的问题是会失去技术的原创性。

中文互联网平台高墙林立，中文语料存在“低质量”问题。但包括车万翔在内的数位与会专家认为，这个问题不如公众认为的严重。车万翔指出，实际在大模型的预料使用中，语言之间存在互通性的，多语言语料是互通、互相支持的。即使Instruct GPT模型96%的指令都是英文，依然不妨碍中文的使用。即使开发中文的大模型，也会同时导入多语言语料使他们互补。

杭州元语智能联合创始人朱雷指出，虽然中文语料的结构、效果都较差，但是有一个优势却不可忽视：高质量的语料很集中地存在于行业之中。因此国内构建行业大模型方面存在巨大的潜力，现在行业内有不少企业有做好行业大模型的信心。

当落地行业

ChatGPT会取代多少员工？

各行各业已经在瞄准ChatGPT所带来的数字化革新机遇，从本次大会上还可发现，在诸如游戏、生物制药的各行各业，已经有一些大模型的相关技术落地应用。

例如行者AI CEO& 创始人尹学渊表示，StableDifussion已经对游戏行业的生产环节产生影响，AI如今已经可以胜任许多美术3D资产设计、音乐BGM设计工作，以及游戏NPC的扮演，AI正在倒逼从业者向创意的方向发展。他认为，AI技术未来有望将游戏行业的生产成本降到目前的1%，这1%主要就是为创意买单。

而朱雷分享了ChatGPT等大模型落地企业时可能出现的问题。他表示，元语智能在业务实践中发现企业在面对ChatGPT等产品时面临着“四大挑战”。

这四个挑战是，第一、如何将过去的数字化成果迁移到这个大模型里面，而不至于浪费掉？第二，如何在所有经营渠道、组织环节去深度部署AI能力？第三，大模型AI技术如何转换成生产力？第四，企业实际想要去运用文心一言、ChatGPT时，面临的成本仍然很高，如何去评估创新等投入产出结构？

此外，ChatGPT已经让人们看到大模型编程的潜力，那么，大模型是否在未来可能彻底取代程序员？

北京大学计算机学院长聘教授李戈团队全世界最早研究自动化编程，他指出，对于复杂环境的编程，目前可以断言不可能将这类工作交给ChatGPT。例如，ChatGPT来编程一旦出现问题，处理方式将于真人截然不同，Debug、Auto testing、Auto fixing等一系列对应技术都亟待研究，要真正实现自动编程，“大模型并非我们所需的全部”。

举报/反馈

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！