国内AI大模型行业火速争霸，巨头扎堆跟进，是创新还是“重复造轮子”？🔥

文心一言 3年前 (2023) lida

86 0 0

文章主题：人工智能, AI大模型, ChatGPT

（图片来源：Shutterstock）

国内人工智能（AI）大模型行业到底有多火？你看看下面消息就知道了。

仅4月18日一天，就有6个关于大模型的重要消息公布：

钉钉宣布正式接入阿里巴巴“通义千问”大模型；字节跳动旗下火山引擎发布自研DPU（数据处理单元）芯片，以及发布大模型训练云平台等；金山办公宣布将推出 WPS AI，类似于基于ChatGPT技术的微软Copilot产品，金山办公CEO章庆元透露这一技术由国内企业MiniMax提供；APUS在北京推出1000亿个参数、自研多模态的天燕大模型AiLMe，以及基于其技术的 7 款 AI 消费端应用App；在上海车展媒体日上，斑马智行宣布接入“通义千问”大模型，智己汽车成为首个上车品牌；百度“文心一言”大模型全面应用内部智能工作平台“如流”。

另外在18日举行的2023全球元宇宙大会上，GPT产业联盟正式成立。据悉，该联盟由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起。

在ChatGPT引领技术潮流之际，众多国内互联网科技巨头纷纷跟进，如阿里巴巴、华为、腾讯、知乎、商汤、百度、京东、360及昆仑万维等企业，纷纷投身于AI大模型的研发竞赛中，展现出强大的实力与决心。行业领军人物亲自挂帅，中国AI领域的“群雄逐鹿”已全面拉开帷幕，一场人工智能技术的盛宴正在上演。这场战役不仅聚焦技术创新，也将推动整个行业的升级与发展，为搜索引擎优化提供有力支持，以适应未来数字化社会的需求。📚💻🔥

🔥海外GPT风潮持续发酵，马斯克引领新潮流！🚀他已确认将亲自打造AI聊天机器人TruthGPT，与OpenAI一决高下，这场创新竞赛备受瞩目。💡微软也不甘示弱，据传正秘密研发专为大模型量身定制的AI芯片——神秘代号“Athena”，剑指技术高峰。🔥未来智能战场，谁能引领潮流？让我们拭目以待！🌟

行业普遍认为，如今大家扎堆创业做大模型是一件好事。

🚀industry innovation is on the rise, as APUS’ visionary CEO 📈李涛 shares his insights. After a period of digital lull, blockchain and Web3 aren’t game-changers, but they ignite excitement. 🚀Tech giants are shifting gears, embracing large model ventures post-pandemic. This isn’t just about economic recovery; it’s a tech revolution, reigniting the passion in every IT professional’s heart. 🌟The industry is poised for significant shifts, and we’re ready to witness the next big leap. 💪

国产GPT模型“大跃进”，避免不了“翻车”

🔥ChatGPT旋风来袭！🚀自2022年11月横空出世以来，这款AI聊天助手的热度一路飙升，访问量已达惊人的8.89亿次大关，仅用短短时间就创造了历史最快破亿月活记录。它不仅席卷科技巨头，学术研究领域亦受影响，产业界更是掀起了一场创新风暴。🌍🔥

🔥ChatGPT热潮席卷全国！国内科技巨头纷纷跟进，阿里云的通义千问、百度的文心一言、商汤的日日新SenseNova、华为的盘古、知乎的知海图AI、360的GPT、昆仑的天工和京东的言犀等重量级模型已崭露头角。🌟小米CEO雷军于4月14日高调宣布，小米将全力拥抱大模型与生成式AI（🔥AIGC🔥），并计划推出创新技术与产品，引领行业风向！🚀未来智能科技，我们拭目以待！

🎉🔥GPT大模型全球爆火，AI热度直线上升，超越了过往十年中国AI的辉煌，也让互联网科技发展历程迎来了全新的挑战！Industry experts are buzzing about the recent surge in domestic AI, reminiscent of the 2021 sanctions on ‘AI Quadruplets’ (S汤、M旷视、C云从、I依图). This is definitely a new chapter for China’s tech scene! 🌐🚀

正如开头所讲，过去一天内，就6个关于大模型的重要消息。

首先是18日上午的北京钉峰会上，钉钉宣布正式接入阿里巴巴“通义千问”大模型，输入斜杠“/”即可唤起智能服务，因此钉钉产品将全面启动智能化战略，升级成为智能协同办公平台、智能应用开发平台。此外，钉钉斜杠还能根据需求撰写文案、设计海报等。

不过在现场演示当中，钉钉似乎出现了“翻车”。在文生图演示中，钉钉出现和文心一言类似问题，即输入“赴汤蹈火”表情，却出现了一锅汤上面有一只着火的类似汤圆造型的动漫人物，随后引发广泛热议。

国内AI大模型行业火速争霸，巨头扎堆跟进，是创新还是“重复造轮子”？🔥

左面两个是钉钉现场演示的“赴汤蹈火”表情包，右侧是钛媒体App在文心一言中输出的“赴汤蹈火”图片

一位参加钉钉发布会的行业人士告诉钛媒体App，当时钉钉总裁叶军并不满意输出的“赴汤蹈火”表情图片，反复更新了三次。

现场视频显示，叶军表示，输出生成的表情包功能同样由阿里巴巴“通义千问”大模型所支撑，此前效果更差，而如今效果好了一点点，“目前通义大模型还在训练中，文生图效果仍有进步空间。”

随着国产GPT模型“大跃进”，演示“翻车”情况似乎避免不了。此前钛媒体App内测时发现，当输入“画一幅‘驴肉火烧”时，AI 会画出一只驴和火；输入“画一幅鱼香肉丝”时，就会出现一只丝装的红色活鱼。百度对此声明称，文心一言完全是百度自研的大语言模型，训练过程中使用了互联网公开数据。

一位大厂的技术负责人王洋（化名）4月18日对钛媒体App表示，上述“翻车”问题意味着产品周期较短，因为 AI 推理应用过程中往往需要更多的数据，但全球互联网产业来看，英文高质量的预料多一些，“我认为（文心一言）确实推出比较匆忙，但我觉得这不是本质性问题，可能需要积累很长时间的中文语料数据集。”

除钉钉之外，4月18日上午，字节跳动旗下火山引擎发布大模型训练云平台，包括自研DPU、机器学习平台等系列云和 AI 基础设施产品，支持万卡级大模型训练、微秒级延迟网络。与大模型不同的是，火山引擎主要为多家大模型公司提供算力等技术服务。据财新，字节跳动两个团队并行做大模型，一个做语言，另一个做音视频。

去年3月，字节跳动曾推出开源大模型训练框架veGiantModel ，性能最高提升6.9倍。

钛媒体App了解到，由于高端GPU存在出口限制，字节跳动此前囤积了大量英伟达A100、V100 GPU（图形处理器）显卡芯片，拥有目前国内性能最高的 AI 算力能力之一，这意味着字节或能直接解决当下 AI 训练与推理所需的算力挑战，而可预见的算力需求激增已经让火山引擎推算力云方案。

国内AI大模型行业火速争霸，巨头扎堆跟进，是创新还是“重复造轮子”？🔥

而在18日下午2点，美团融新科技中心办公室楼上，一家刚刚战略转型 AI 技术的麒麟合盛网络技术股份有限公司（APUS），正式推出1000亿个参数、自研多模态的天燕大模型AiLMe，以及基于该模型的智能问答大师、简笔成画等 7 款 AI 消费端产品。公司创始人、CEO李涛向钛媒体App透露，为了做好大模型，APUS前期累计花掉接近1000万美金。（详见钛媒体App前文：《APUS发布1000亿天燕大模型AiLMe，CEO称日活用户已超百万》）

此外，4月18日，金山办公正式发布具备大语言模型能力的生成式人工智能应用“WPS AI”，搭载在其新一代在线内容协作编辑工具“轻文档”（airPage）上，据金山办公CEO章庆元透露，WPS AI所用大模型非OpenAI，由国内合作伙伴MiniMax提供；同时在上海车展期间，阿里集团旗下的斑马智行宣布接入“通义千问”大模型，智己汽车成为首个上车品牌；百度则宣布“文心一言”大模型全面应用内部沟通产品“如流”当中。

如今，为了争夺“中国版OpenAI”席位，科技巨头、商业大咖纷纷下场加入ChatGPT竞争当中，“重复造轮子”情况已然发生，“你有我也要有”、“人人都做大模型”时代正在到来。

李涛对钛媒体App表示，今天，整个中国的 AI 相当于全球来说是比较落后，无论是比OpenAI，还是比谷歌，还是比Meta，中国 AI 落后的绝对不是两个月、三个月的问题，起码落后两年以上。但我们要相信，未来很长时间里面，AI 迭代，算法快速改进和优化可能会帮助中国快速大踏步追赶，甚至有机会跟世界拉平。“我不愿意用弯道超车，事实上没有弯道超车的可能性，所有的机会都是要付出足够大的成本，付出时间、精力、物力才能做到。”

对于是否存在大模型“重复造轮子”，王洋对钛媒体App表示，从商业角度来说，重复做大模型的情况很正常。科技大厂一定会在大模型领域展开竞争、合作，需要市场的商业化。这是一个非常严酷的市场检验过程，否则企业就永远是“温室里的花朵”。

搜狗创始人、百川智能创始人王小川告诉钛媒体App，他认为最终科技大厂会一人推出一个模型，本轮参与的创业公司里面可能最终只有不到5个大模型会拿到“通行船票”。

ChatGPT算力不足，传微软正自研AI芯片“Athena”

与国内“百模大战”一样，国外ChatGPT热潮似乎也未结束。

继特斯拉CEO马斯克（Elon Musk）宣布做ChatGPT竞品TruthGPT之后，据The Information 4月18日报道，创造ChatGPT的美国OpenAI公司，其背后的大股东微软正在开发自研的AI芯片，内部代号「雅典娜」（Athena），300人共同研发。

据两名知情人士透露，微软正在开发代号为“Athena”的AI芯片，以便应用于ChatGPT背后的生成式AI技术，包括训练大型语言模型（LLM）和AI推理（inference）。据悉，首款Athena芯片将采用台积电5nm工艺。

消息称，微软早在2019年就已开始著手研发这款芯片，由微软和OpenAI员工共同进行测试，微软目前使用的AI芯片是对外采购，而非自家产品。微软希望Athena AI芯片的性能能够超越供应商的芯片，以进一步降低开发AI所需耗费的资金成本和时间。目前，微软等厂商已经在其60多个数据中心部署了数十万张GPU芯片，用于 AI 模型的日常推理。

事实上，随着生成式 AI 大爆发，包括亚马逊和谷歌等科技巨头都已推出自研AI芯片。去年11月，亚马逊宣布推出高性能服务器芯片Graviton 3E，挑战英特尔和英伟达。

不过，一方面是算力需求增长较快，包括亚马逊、微软、Google 和甲骨文等主要云计算供应商都在限制客户对云服务器的使用，租用硬件的等待时间长达数月，核心问题仍是GPU（图形处理器）等算力芯片供不应求；另一方面，目前在机器学习、加速计算等领域，英伟达（NVIDIA）GPU领域市占率高达95%以上，至今没有对手可以匹敌。

国内AI大模型行业火速争霸，巨头扎堆跟进，是创新还是“重复造轮子”？🔥

早前美国媒体报道称，马斯克囤积购买了约1万个GPU芯片，用来处理 AI 大模型项目TruthGPT，而且将推特的两个数据中心用起来，使用推特的内容作为数据，来训练其语言模型，也可以利用特斯拉的计算资源。

根据英伟达官方信息，训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片，同时，OpenAI可能至少需要3.24万张A100用于日常推理，显著高于此前训练底层模型时的用量，以此推算，ChatGPT硬件成本达8亿美元以上。

研究公司SemiAnalysis首席分析师迪伦·帕特尔 (Dylan Patel）表示，经计算，ChatGPT运营成本每天约为70万美元，大部分成本是基于所需的昂贵服务器。“与英伟达的产品相比，微软Athena如果具有竞争力，可以将每个芯片的成本降低三分之一。因为基于GPT技术的微软产品，未来如果使用现成的硬件大规模部署，每年将花费数百亿美元。”

Forrester Research分析师Tracy Woo 表示，AI 技术的繁荣给云厂商带来了很大压力，要求他们开发自己的芯片。“你可以从英伟达购买，但谷歌、亚马逊这样的巨头，他们有足够的资金来构建和设计自己的芯片。”

另据报道，网络芯片巨头博通（Broadcom）4月18日发布最新ericho3-AI芯片，用于将超级计算、AI 大模型等领域，可将多达3.2万个GPU芯片连接在一起，将与英伟达等公司竞争。

随着GPT-4发布，市场普遍认为需百倍的芯片及其算力支持，英伟达（NASDAQ: NVDA）股价也随即飙升，年初至今已大涨86%以上。（本文首发钛媒体App，作者｜林志佳）