国内大模型竞赛开启,ChatGPT之后,百度文心一言与阿里通义千问引领新赛道,B端市场或成最大赢家
文章主题:
以下文章来源于凤凰 WEEKLY 财经 ,作者张轶骁
烧钱才刚刚开始。
作者:张轶骁
来源:凤凰 WEEKLY 财经(ID:fhzkzk)
” 大模型 ” 开始扎堆了。
从百度文心一言上线开始算起,一个多月时间内,国内版 ” 大模型 ” 争先恐后,鱼贯而出。
🎉🚀随着各大科技巨头如阿里巴巴和商汤纷纷推出先进的人工智能模型,比如盘古大模,华为也紧随其后,展现出强大的技术实力。ChatGPT的热度不仅引发了市场的广泛关注,各类模仿者如雨后春笋般涌现,争相打造自己的类ChatGPT产品,形成了繁荣的景象。🚀🌈
最新的消息是科大讯飞,5 月 6 日,科大讯飞将正式发布讯飞星火大模型。
阿里巴巴集团董事会主席兼 CEO 张勇的一句话,或许道出了如今大模型大热的原因:所有产品都值得用大模型重做一遍。
🚀曾经,互联网犹如一阵狂飙,席卷着传统物件,让它们瞬间变身:单车摇身变为共享单车,马扎共享为共享马扎,雨伞携手成了共享雨伞,充电宝也加入了共享大军。🔥然而,这股热潮并未持久,烧钱的硝烟过后,市场洗牌无情,许多曾经耀眼的存在逐渐消失在历史的尘埃中。💻
如今这一幕,或将又在大模型热中重现。
01大模型,让大厂再度 ” 跑起来 “
百度文心一言之前,独领大模型风骚的是 ChatGPT,国内公众只有羡慕嫉妒恨的份儿。
文心一言出来后,国内对大模型的讨论、对比、褒贬才显得真切并言之有物起来。
🎉🚀 文心一言不只是个话题,它正引领着人工智能语言的新篇章。虽然初期难免存在不足,但这背后的超大规模预训练模型确实展现出了惊人的潜力。对于科技爱好者来说,这不仅是技术突破的见证,也是未来趋势的信号。别忘了,创新的路上总有些波折,但正是这些挑战推动了进步。让我们一起期待它不断优化,为用户提供更精准、流畅的智能服务吧!🔍💼
🌟💡【揭秘】预训练通用大模型:🔥超越传统,引领未来的大脑力量!🚀在AI的世界里,”大模型”并不是简单的大小概念,而是一种革命性的技术力量。它不同于那些专攻特定领域的小巧型”专家”,也不仅仅是垂直于某一行业的大规模”垂直巨无霸”。🌟🔍预训练通用大模型,就像一个全能的超级大脑,经过海量数据的洗礼,具备了跨领域的学习和理解能力。它可以轻松适应各种任务,从语言生成到图像处理,都能游刃有余。🌍💻这种模型的独特之处在于其普适性与灵活性,它打破了传统界限,为AI的发展开辟了全新的道路。它不仅提升了工作效率,还推动着创新的边界无限延伸。🚀🌈SEO优化提示:使用长尾关键词如”预训练通用大模型、跨领域学习、AI未来趋势”等,增加emoji符号以提升可读性和情感表达,保持内容积极且专业。
早期的人工智能是针对特殊应用场景进行的训练,例如,翻译功能只能用于翻译,画图功能只能用于画图,两者之间并不联通。
🌟🚀 大规模模型革命性地通过海量数据赋能,打造了一套通用性强、实用价值高的基础模型,显著提升了AI的普适性和效能。💡只需对特定应用场景稍加定制,就能快速生成满足需求的应用解决方案。🔥
🌟💡 大模型,即全能料理包🌟💪!🚀 数不尽的食材原料,经过精心炮制,化身为多功能美食神器。只需轻轻一取,按需搭配,简单几步,满足各类口味定制。🌍🍽️ 让餐桌上的每一道菜都充满惊喜与创新!👩🍳👨🍳 #料理创意 #食材魔术
当 ChatGPT 席卷全球的时候,拥有大模型的百度,可以迅速依靠大模型拿出一套应用,来对标 ChatGPT,并将应用植入到搜索等诸多场景之中。
除了文心一言之外,百度方面还透露,文心已累计发布 11 个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。
华为的《预训练大模型白皮书》曾经这样描述预训练大模型的意义,在下一个划时代的计算模型出现之前,预训练大模型将是人工智能领域最有效的通用范式,并将产生巨大的商业价值。
而且,相比于普通开发者从头搭建的算法,其精度明显上升,数据和计算成本明显下降,且开发难度大大降低。以计算机视觉模型为例,其开发成本只相当于原来的 10% 甚至 1%。
这样的机会,没有哪个大厂愿意错过。
继 3 月 16 日百度文心一言发布后,阿里和商汤分别于 4 月 7 日和 4 月 10 日发布了类 ChatGPT 产品 ” 通义千问 ” 和 ” 商量 SenseChat”,其背后对应的分别是阿里的通义大模型和商汤的日日新 SenseNova 大模型。
根据民生证券研报统计,目前国内至少已经有 30 多家大模型亮相,其中不乏参数规模甚至超过 ChatGPT 规模的大模型。厂商涵盖了互联网巨头、AI 上市公司、服务器龙头企业、科研院所与一级市场创业公司。
还有一个动力,来自于大厂自身。
经历了增速放缓、向内要利润带来的 ” 阵痛 ” 之后,大模型可能是互联网大厂的下一个,也是唯一一个能恢复 ” 狂飙 ” 状态的新领域。
过去一年,伴随着种种原因,大厂们都忙着做减法,不赚钱的业务果断关停,没有前景的项目果断砍掉,给内部试错的机会和时间都越来越少。
这与大厂此前的态度截然不同,对互联网企业来说,只要业务本身健康、赚钱,有毛利,能继续用投入换来商业模式的升级、人员结构的稳定和新的业务产出,净利方面,亏点钱算不得什么。
但一旦大厂进入 ” 要利润 ” 的阶段,同步带来的就是放慢脚步,降本增效,裁员和 ” 毕业 ” 的戏码就会时常上演。
大模型的出现,显然是给大厂指了一条向前 ” 狂飙 ” 的新赛道,既有商业价值,又有成长空间,唯一差的就是投入。
而对互联网大厂来说,只要能看到出路,能讲出故事,以大厂的名头,不愁没钱可烧。
02大模型 全行业
如今的人工智能,刚刚通过 OpenAI 与 ChatGPT 看到了商业化的曙光。
除了文心一言应用于搜索之外,阿里的通义千问将目光聚焦在了协同办公。在为数不多的 C 端应用场景中,搜索、办公这些偏向标准化的场景,是人工智能大模型和人工智能应用最好的用武之地。
4 月 7 日,通义千问的发布会上,阿里已经将钉钉当作了人工智能应用的重要场景。例如,钉钉接入通义千问之后,可以在文档中创作诗歌,撰写邮件、方案等。在会议中,可以生成会议记录,总结会议纪要等。在群聊中,可以自动总结群聊信息中的要点等。
这与微软有着相似之处。
就在 3 月 17 日,微软已基于 ChatGPT,为 Office 开发出了名叫 Copilot 的新功能。官网介绍称,在 Word 中,Copilot 能为用户提供初稿以供编辑,能节省写作、找资源和编辑的时间。在 PPT 中,可以帮助用户通过简单的提示创建演示文稿。在 Excel 中,可以帮助用户分析数据。
透过 ChatGPT 生长的土壤,大模型更像是一个超级的 App,或者是一个超级底座。
在这个底座基础上,各家科技企业将自己所掌握的人工智能技术,与各行各业的需求结合,训练、生成自己的应用和服务,并通过应用和服务获取收益。
通过这种过程,原则上来说,只要有细分领域数据,大模型就可以针对垂直领域做优化,赋能各行各业。
这意味着,与 ChatGPT、文心一言、通义千问等常见的 C 端应用不同的是,大模型的真正用武之地和赚钱之道,来自于 B 端。这是互联网 ” 人口红利 ” 增长见顶的当下,大厂们最需要抓住的领域。
商汤科技联合创始人、首席科学家王晓刚在大模型发布活动上表示,商汤版的 GPT 主要面向企业端(B2B)业务。此外,商汤 ” 日日新 SenseNova” 大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等 API 接口。
华为也是如此,华为盘古大模型早在 2021 年就已经发布,时至今日,华为并未追随文心一言、通义千问等推出偏向 C 端的应用。
相对而言,华为云 AI 已经在各行业有超过 1000 个项目,迄今为止基于盘古大模型,陆续推出了矿山、制药、气象、海浪等大模型。
例如,矿山大模型作为行业类的预训练模型,可以基于采矿业的数据、地质情况,迅速学习矿业知识,进而生成针对不同矿藏的应用,解决井下采矿的智能化、自动化问题。而海浪大模型,则可以根据海洋数据,在渔业等海洋相关的行业内应用,减少人工海上作业的风险。
国金证券研报认为,华为的盘古大模型具备 ” 一个模型在众多场景通用、可泛化和规模化复制 ” 的特点,让 AI 开发模式由作坊式向工业化转变。
对大厂们来说,一个天然的优势是,大厂自身就通过投资或实际经营涉足了诸多行业,本着 ” 肥水不流外人田 ” 的原则,大厂的自身业务,既可以成为最先享受到人工智能赋能的领域,也是大模型最好的 ” 试金石 “。
李彦宏曾经介绍,百度计划将多项主流业务与文心一言整合,涉足的业务包括搜索、百度智能云、Apollo 智能舱,以及小度。
张勇也表示,阿里巴巴所有产品,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等,未来都将接入 ” 通义千问 ” 大模型进行改造。
03
烧钱的战事,才刚刚开始
大模型之争,才开了个头,大戏还在后头。
华为《预训练大模型白皮书》中指出,通过大模型构筑 AI 技术竞争壁垒,是当前中美 AI 技术竞争的热点。
围绕大模型的竞争,不外乎两个因素:财力和算力。
毋庸置疑,大模型是一项极为烧钱的事物。
《财经十一人》援引多位技术人士的观点总结称,大模型的投入成本包括,一个智算集群的建设成本约 30 亿元,一次完整的模型训练成本少则千万元,多则上亿元。这还没算数据采集、网络带宽、电费等成本,也有数亿元的开销。
此前有消息称,微软仅仅是在 ChatGPT-3 的训练中,就投入了 1200 万美元。而 OpenAI 在过去一年中烧掉了 5 亿美元。
以微软过去一年 727.38 亿美元的净利润来透视,这笔投入尚在能负担得起的范畴。而放到国内,既有资金实力,又有云业务作为基础的企业,也就是华为、百度、阿里、腾讯等少数几家头部互联网大厂。至于现在才刚刚开始投入大模型的创业者,能扛到最后的概率更是非常渺小的。
除了钱之外,算力方面,中国也处在 ” 卡脖子 ” 的阶段。代表着算力最高性能的英伟达 A100 和 H100 芯片被限制向中国出售,能够获得的最佳替代品 A800 也处在供不应求的状态。
这样的劣势,会带来 AI 大模型训练的准确度和反应速度都不足。反映到具体的应用中,就体现为文心一言、通义千问的 ” 智商 ” 远低于 ChatGPT。
财力和算力都不占优,中国企业唯一可能有所作为的,是数据。这也是每一家大厂的看家宝贝。
伴随着 ” 所有产品都值得用大模型重做一遍 ” 的口号,另一个可能出现的现象是 ” 所有的数据壁垒也都会在大模型上重建一遍 “。
很多人或许还能想起,互联网巨头们画地为牢,搭建起一个个生态孤岛的时代。微信无法分享淘宝链接,淘宝也不能使用微信支付,用户、数据、基础设施和信息的自由流动都因此割裂开来。
如今,互联互通的时代早已来临,但大模型之于当今各行各业的意义,仍然与早年间支付宝、微信的意义相差无几。对于拥有大量数据的互联网大厂来说,无外乎两条路,要么下场砸钱,做出属于自己的通用大模型,或至少是针对细分领域的垂直大模型;要么乖乖将自己的数据捧到别家大模型的手里。
国盛证券研报认为,即使大模型已经拥有强大智能,但可能缺乏特定场景的知识,也需要结合具体场景的需求,因此在落地时依然需要场景数据进行微调。
换句话说,有了大模型,就有了吸取各行各业数据的入口,也会在智能化水平、赋能水平上形成自己的护城河,高出其他没有大模型的厂商一头。
因此,才有了脉脉创始人林凡爆料称,”ChatGPT 带动的 AIGC 创业热潮要来了,猎头已经开出 10 万月薪抢人。” 以及,不少人工智能企业都释放出岗位,争抢最顶级的算法工程师。
但更重要的是,从国内的视野来看,大模型的商业化落地尽管有了部分进展,例如华为依托盘古大模型训练出来的矿山大模型已经在山东的能源企业得到应用,但总体而言,大模型的商业化落地并不稳定,不足以拿出去给外人看。更多的企业还是在像百度文心一言上线初期一样,处在疯狂 ” 摇人 ” 测试性能的阶段。
有业内人士认为,这种疯狂的创立大模型,训练大模型的窗口期不会太长,最多半年到一年,就会有出局者诞生。但大模型真正带来稳定的商业化落地,改变各行各业,形成新的生态,为互联网企业带来稳定的收益,还需要更长的时间。
由此看来,烧钱的战事,才刚刚开始。
* 免责声明:本文章为作者独立观点,不代表创业家立场。
扫码加入黑马创业交流群
让创业者不再孤独
↓↓↓
成为产业新力量黑马营 26 期重磅开启
↓↓↓
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!
转载请注明:国内大模型竞赛开启,ChatGPT之后,百度文心一言与阿里通义千问引领新赛道,B端市场或成最大赢家 | ChatGPT资源导航