国内独角兽能否撑到GPT-4？对话复旦教授看大模型未来

AI老师 1年前 (2024) lida

338 0 0

文章主题：关键词:中美大模型差距, GPT-4水平, AGI, OpenAI

复旦教授谈中美大模型差距：国内独角兽如果不走错，咬咬牙能撑到GPT-4水平

搜狐科技《思想大爆炸——对话科学家》栏目第69期，对话复旦大学计算机科学技术学院教授张奇。

嘉宾简介：张奇，复旦大学计算机科学技术学院教授、博士生导师，复旦眸思（MouSi）大模型负责人，MOSS大模型核心人员，兼任中国中文信息学会理事。发表论文150余篇，获得美国授权专利4项，著有《自然语言处理导论》、《大规模语言模型：从理论到实践》。

国内独角兽能否撑到GPT-4？对话复旦教授看大模型未来

划重点：

🌟Claude3虽名列榜首，但超越GPT-4的含金量并不等同于其排名本身。实际上，与GPT-4的直接较量中，用户仍能感受到显著的技术差距。尽管进步显著，大幅超越的前景依然模糊。🚀SEO优化提示：#技术挑战#GPT-4#未来超越

🌟[GPT-4: 文本理解新高峰，技术瓶颈与未来展望】🚀随着人工智能领域的不断突破，我们见证了统计机器学习在文本理解方面的卓越飞跃——GPT-4无疑树立了这一领域的又一座里程碑。然而，攀爬创新的顶峰并非易事，它带来的挑战与技术曲线的放缓迹象并存。🌟大模型技术的发展正逐步进入一个成熟期，增长的步伐开始放慢，这不仅是对现有能力的考验，更是对未来突破的呼唤。我们期待看到如何在既有基础上，跨越这一可能的技术鸿沟。🔍尽管如此，这并不意味着停滞不前——反而，它可能是孕育新突破和革新的契机。探索更为高效、精准且人性化的文本处理方式，将是未来AI研究者们的重要课题。🌟SEO优化提示：GPT-4, AI技术进步, 文本理解高峰, 模型增长放缓, 技术瓶颈, 未来发展

🌟 AGI的基石无疑是强大的推理技能，然而当前市面上的大型模型在这方面仍存在显著不足。若无法突破这一瓶颈，即便拥有再庞大的模型阵容，AGI的梦想也难以成真。🚀原文中的技术细节和具体联系可以巧妙地融入到改写后的描述中，例如提到”先进的AI算法如何通过深度学习提升推理效能”，或者”行业领先的团队如何致力于研发能够实现强推理的大规模模型”等，这样既能保持信息的准确性，又避免了直接提及个人或公司。同时，确保使用关键词和短语与目标搜索引擎优化的主题相关，如”AGI发展”、”推理技术进步”等。例如：🚀通过先进的AI算法和深度学习技术的不断演进，我们正见证着大型模型在推理能力上的显著跃升。然而，迈向通用人工智能的道路并非一蹴而就，强大的推理技能是实现这一目标的关键所在。🔍这样既保留了原意，又进行了适当的优化，符合SEO要求。

🌟关注未来趋势，国内大模型发展面临挑战💡。尽管资源有限，但技术创新的步伐不容忽视🚀。若对技术有坚定信念，并寻求资金支持，跟随OpenAI的脚步是明智之举🌈。然而，仅靠资金并非唯一关键，创新实践同样重要🔍。即使暂时无法跟进，保持探索和学习的态度，未来总有追赶的机会🌈。别忘了，每个阶段的突破都需要时间和耐心，坚持才是王道🏆！

🌟🚀保持对OpenAI创新的密切关注，虽然投资规模可能与之相当，但我们坚信实现这一目标并不需要天文数字——远低于10亿至20亿美金的大手笔。尽管挑战重重，但只要技术可行且市场需求明确，我们对未来的合作充满期待。🌍💡

出品 | 搜狐科技

作者 | 梁昌均

🌟🚀引领未来，不止模仿步伐！💡曾经，对OpenAI的挑战与探索，是技术创新的热切追求。而现在，一个崭新的里程碑由 Anthropic 打破，他们成功地将追赶梦想变为现实。🏆💡拥抱变革，不只停留在跟随，而是跃升至引领者的行列。让我们一起，以开放的心态，学习他们的智慧，成为那个定义未来的力量。🚀🌈想要超越？不妨先理解并超越他们所展示的卓越。OpenAI或许仍是灯塔，而 Anthropic 正在点亮新的篇章。🏆💡🌟

这家被谷歌、亚马逊等投资的公司最新推出的大模型Claude 3，评测性能碾压GPT-4，成为OpenAI的最强竞对。这似乎又让国内大模型燃起了希望——OpenAI并不是无法超越的神话。

不过，复旦大学计算科学技术学院教授张奇对此保持着冷静。作为国内高校率先推出对话式大语言模型MOSS的核心研发人员，张奇对国内外大模型进展，时刻保持着关注。

他认为，榜单参考意义不大，从其团队评测和实际体验来看，GPT-4仍然领先，想要达到GPT-4还是很难，大幅度超越的可能性就更小。

早前，OpenAI剧透文生视频模型Sora，逼真的视频效果再次惊艳科技圈。周鸿祎甚至直言，Sora将AGI的实现从10年缩短到1年。

“它生成视频的长度、精度及效果比较惊艳，而且加了世界模拟，使大家有无限的遐想。”但张奇认为，Sora还无法通过视频学习到物理世界的知识，四条腿的蚂蚁就是例证。

张奇表示，大模型现在最弱的就是推理能力，这是AGI（通用人工智能）最核心的能力，但在统计机器学习的范畴下，其很难提升。

“如果大模型不具备推理能力，那它就是一个知识的压缩器和检索器，AGI就不可能实现。从这种角度上来看，我个人觉得AGI还远着呢。”张奇说。

无论是ChatGPT，还是Sora，都是暴力美学的胜利，其背后则是scaling law（规模定律）在发挥作用，甚至不少观点视其为大模型时代的“摩尔定律”。

张奇认为，scaling law带来的是知识记忆和多任务混合能力的提升，但最核心的还是要具备推理能力，只扩大参数没有太大意义。

同时，他认为，大模型的技术增长曲线放缓会非常快，且现在已经处于放缓的状态。“GPT-4应该是统计机器学习在文本理解上的一个巅峰，再往上难度可能很大。”

目前，业内都普遍预计OpenAI会在年内发布GPT-5。张奇判断称，GPT-5在技术线路上不会有大的改变，会加上视频理解，是否会有视频生成要看Sora何时正式发布，惊艳程度则要看它如何找一些特定应用场景来展示。

随着OpenAI不断掏出新的武器，国内外的差距也一直是争议焦点。目前，国内大模型市场派居多，这种情况下，我们是否还要追赶 OpenAI？

张奇表示，要想全面追赶OpenAI，难度很大，如果没有更多的资源持续投入，那肯定差距会扩大。“如果有技术信仰，又能搞到资金，就应该去follow OpenAI，如果不去试，那永远不可能追得上。”

金沙江创投主管合伙人朱啸虎此前认为，跟着OpenAI后面走，能少花一个数量级的钱。对此，张奇并不认同。

“我们follow OpenAI的工作，所要花的钱可能并不会比OpenAI少。”他认为，这件事并没有捷径，很多基础的钱逃不掉，技术试错成本很高。

据张奇团队预测，完全复现GPT-4，至少需要20亿人民币，稍微走些弯路，可能就需要40亿以上，然后还需要用户推广等商业资金，因此需要百亿资金或10亿-20亿美金，才有可能做成。不过，张奇坚信，国内一定会有一家公司做成，追上OpenAI。

当然，张奇也表示，如果拿不到这么多的投资，那就选择场景，做产品落地。“但怎么达到用户长期稳定的使用，或者是否可以大幅度提升效率，这样的场景是不是有？大家也都比较焦虑这件事情。”

大模型似乎陷入了技术和商业的两难当中，是一往无前，还是掉头转向，可能会是接下来很多公司需要做出的抉择。

以下是访谈节选（经编辑整理优化）

GPT-4仍很难超越，GPT-5会有视频理解

搜狐科技：不久前发布的Claude3性能号称碾压GPT-4，您怎么看？

张奇：我们自己的数据集评测下来，初步结果，感觉它并没有超过GPT-4。伯克利大学做的LMSYS评测，应该也没有超过GPT-4。榜单的意义可能越来越低，尤其是公开的测试数据，参考意义基本为零，更多还是要看真实的使用体验。我认为现在达到GPT-4可能依然很难，大幅度超越的可能性很小。

搜狐科技：Claude3在多模态上说超过GPT-4，目前业内对大模型多模态怎么看的，尤其是Sora出来以后？

张奇：多模态主要就是多模态的生成和理解。大语言模型一定要具备多模态的理解能力，不仅仅是图片，还包含video。生成能力有很多评价维度，也没有好的评价准则和手段，要看用户自己的体验、对指令的服从等。OpenAI的视频生成技术，至少现在可能没有人敢说可以达到它的效果。

搜狐科技：Sora很惊艳，也引发了争议，一方认为这意味着AGI实现大大缩短，但杨立昆等人不以为然，您怎么看它对AGI的意义？

张奇：文本生成视频，OpenAI今年一定会做，这没有超出预期，但生成视频的长度和精度以及效果比较惊艳，而且它加了世界模拟这样一个词语，使得大家有无限的遐想。如果它看视频就能学会物理世界的知识，那当然对推动AGI有很大帮助。但从目前的技术路线和角度来看，我个人觉得它根本就没有学世界知识，还是相关性，并没有学到因果。

搜狐科技：很多人都预测OpenAI今年一定会发GPT-5，您预计它会在哪些方面提升？还能带来惊艳的效果吗？

张奇：GPT-5技术路线不会有大的改变，它一定会加上视频理解，生成视频不确定。Sora迟迟不往外发布，我觉得是效果太差的原因。视频生成的稳定性、一致性、连贯性等问题，可能用统计学习的方法很难避免。其它部分可能就是做些升级，惊艳程度就看它怎么找一些特定应用场景来展示。

技术增长曲线已在放缓，大模型推理能力还很弱

搜狐科技：ChatGP刚出来很惊艳，现在感觉技术增长曲线是不是在放缓，您怎么判断的呢？

张奇：我觉得GPT-4应该是统计机器学习在文本理解上的一个巅峰，再往上我觉得难度可能很大。当然可以再投入更大的资源，把60分、70分的部分提到90分，但这不改变本质。技术曲线肯定会放缓非常快，现在已经处于放缓的状态。

搜狐科技：ChatGPT和Sora背后都是scaling law在发挥作用，很多人认为这是大模型性能提升的核心，您怎么看？

张奇：很多人提的scaling law更多是说所谓的涌现，以及模型足够大了之后，这东西就是AGI了，这我不是很认可。它能提升知识的记忆能力，但能灵活运用吗？能融汇贯通吗？我觉得最核心的在于它是否具备真正的逻辑推理能力，仅仅是知识记忆能力，或者只扩大参数，没有太大意义。

搜狐科技：大模型被视为AGI的一条路径，离AGI还有多远也有很多讨论，从AGI角度来看，目前大模型最缺什么？

张奇：AGI如果缩小定义来看，就是要去完成人的智力工作，那我觉得最核心的就是要具备语言知识学习和推理的能力。学习对模型来说难度非常大，很多常识知识，它答不上来，也学不会。

人用的最多的就是演绎推理和归纳推理，但现在大模型推理能力还很弱，它能不能扩展，程度有多大，还要去做研究。如果大模型不能构建出来推理能力，达到非常好的泛化能力，它就是一个知识的压缩器和检索器。那我觉得靠大模型这条路线，AGI就不可能实现。从这种角度上来看，我个人觉得AGI还远着呢。

搜狐科技：为什么现在大模型还学不会推理？OpenAI也做不到？

张奇：这条路径不一定是对的，Transformer、大规模无监督训练，都仅仅体现的是相关性，很难学习到因果性。这种神经网络架构，依然还是统计机器学习的范畴。

我觉得再往后发展，应该完全脱离统计机器学习的架构。但是脱离之后难度在于哪儿呢？因果性怎么体现，怎么建模，没有好的数学方法和工具。这可能需要非常有creative idea的人做，现有的商业逻辑也支撑不了这件事情。

复现GPT-4至少要20亿，能搞到钱就应follow OpenAI

搜狐科技：Sora出来以后，GPT-5可能也要发，很多人觉得我们跟OpenAI的差距更大了，您觉得呢？

张奇：GPT-4出来，大家都说一年后要追上，Sora出来后，国内基本没人说跟了。OpenAI在发GPT-3.5的时候就已经烧了40亿美金，Sora可能没有五亿人民币或一亿美金做不到。OpenAI有很多条线，Agent、GPT-5、GPTs等，每条线可能一年都是上亿美金的消耗。全面追赶，我觉得难度很大，如果没有这么大的资源持续投入，那差距肯定会扩大。

搜狐科技：很多公司曾表态要赶超OpenAI，但现在想的更多是怎么去赚钱，市场派成了主导，怎么看这种转变？

张奇：大厂前面为了复现GPT-4，可能十几个亿扔下去了，还没有达到这个水平，然后还要去进行产品化，体现在使用人数跟B端买单的token数。但如果投入和回报严重偏差，那往后更多投入肯定心里会打鼓。

所以现在更多考虑说，基于GPT-3.5到GPT-4的中间状态，进行转化。如果有正向回报，那肯定愿意投。但怎么达到用户长期稳定的使用，或者是否可以大幅度提升效率，这样的场景是不是有？我觉得大家也都比较焦虑这件事情。

搜狐科技：在差距扩大、市场导向的情况下，我们到底还要不要去follow OpenAI？

张奇：如果有技术信仰，又能搞到资金，就应该去follow。如果没有钱去试，那永远不可能追得上OpenAI。国内应该有投资机构站出来，大规模地去投，他们可能会从商业逻辑上考虑，但还是应该有人应该坚定地投下去。

搜狐科技：朱啸虎此前说我们跟着后面走，能少花很多钱，您也是这么看？

张奇：我觉得我们follow OpenAI的工作，所要花的钱可能并不会比OpenAI少。按我们的估算，完全复现GPT-4，不走弯路，可能至少要20亿人民币；稍微走点弯路，可能要往40亿去烧，还得再准备用户推广等商业部分，所以没有百亿或者10亿-20亿美金，这事儿基本没啥希望。

如果能够拿到这么大的资源，就去复现GPT-4，但真正意义上达到GPT-4，可能并没有捷径，很多基础的钱逃不掉，有人愿意投资当然是最好的。如果拿不到，那就选择场景，做产品落地。

搜狐科技：很多公司曾说要做中国的OpenAI，我们还有技术信仰能赶超吗？

张奇：我觉得并不是说国内没有这样的技术信仰，国外也就仅此一家，Google都不敢投。OpenAI在2020年前的投资大部分都是捐赠，没有考虑回报，但国内很难找到这样的投资商，并且这么大规模。国内能不能有这样的环境，让科学家们可以坚持20年，就认准自己的事情去做，国内这方面长期缺乏。

现在国内至少有五家都是独角兽规模，如果不走错，咬咬牙应该能支撑看到GPT-4这些情况。但稍微走错一点，可能公司就没了。这个风险很大，试错成本很高，国内的人才差距也很大。但我相信中国肯定会有一家能成，大概率是这五家中的一家。返回搜狐，查看更多

责任编辑：

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

版权声明：lida 发表于 2024年4月12日 pm12:47。
转载请注明：国内独角兽能否撑到GPT-4？对话复旦教授看大模型未来 | ChatGPT资源导航

这位“AI老师”火了！45中、50中…合肥这些名校都能找到ta！

揭秘！文心大模型赋能，小度Z30打造未来教育新力量，让孩子爱学、会学、学得更好？

da, li

伦敦私立学校David Game College即将开设英国首个AI课堂，现场无老师授课。

da, li

🔥你真的了解自己吗？一探究竟，改变从现在开始！👩‍💻

da, li

典型案例来演示！东孚长长GPT——让老师备课更专业！

da, li

最适合理科教师的AI：橙篇，只因这一点！

da, li

国内独角兽能否撑到GPT-4？对话复旦教授看大模型未来

ChatGPT是否写论文？中国地质大学教授署名论文调查进行中...

星星孩子闯AI世界：孤独症学生如何在数据标注课上找到自我与未来？

相关文章

相关文章