文章主题:AI大模型, 互联网企业, 科技企业, 垂类派
图片来源@视觉中国
文 | AI产业研究中心
在过去的几个月里, ChatGPT在全球范围内迅速走俏,这一趋势也带动了我国 AI 大模型赛道的热情急剧升高。众多业界精英纷纷推出自家的大模型产品,如同八仙过海,各自展示出独特的才华和能力。
在我国的科技领域,一场激烈的竞赛正在进行,那就是谁能够率先开发出与ChatGPT相媲美的AI应用,谁将成为我国自己的Open AI。这两个问题,不断刺激着国内众多互联网大亨和科技巨头们的心灵。这也预示了我国AI产业的发展趋势,已经从1.0版的“分封割据”阶段,步入了2.0版的“战国”时代。目前,国内AI界正围绕着“大模型”的发布展开了一场激战。
国内生成式AI大模型界进入“五霸七雄”争锋时代
对于当前国内参与AI大模型竞赛的参与者而言,根据他们所涉及的产品落地行业属性,我们可以将其主要划分为两大阵营:“互联网领域”与“AI科技流派”。
在当下互联网领域,那些已经拥有具体产品的知名互联网公司,尤其是百度、阿里巴巴、腾讯、网易以及京东这五家公司,成为了这个行业的代表。在这些企业中,百度和阿里巴巴率先推出了自家的超大规模语言模型“文心一言”和“通义千问”,并且已经开放了内测阶段。紧接着,腾讯、网易和京东也纷纷跟进,各自公开了自己的大模型产品“混元”、“玉言”和“ChatJD”,并提前预告即将上线发布。正因为这些企业的积极推动,使得他们在互联网大模型领域成功崛起,被誉为“五霸”。除此之外,还有像知乎、网易、360等其他互联网企业,也在积极推出新产品或者研发计划,进一步丰富了该领域的产品生态。
相应于“AI科技派”的是以AI为核心技术的硬核科技企业群体。他们并不愿意落在潮流后面,纷纷积极推出自家的重大模型方案和发展策略。在这些企业中,华为、商汤科技、科大讯飞、深兰科技、昆仑万维、出门问问、智源研究院这七家单位尤为具有代表性。值得注意的是,在今年四月份,这些科技企业集中发布了多款重大模型,例如华为推出了“盘古”,商汤科技推出了“日日新”,科大讯飞推出了“星火”,深兰科技推出了“天工”,昆仑万维推出了“序列猴子”。因此,这七家科技企业被业界尊称为大模型界的“七雄”。
由此,国内生成式AI领域的“大模型混战”,就此全面开打。
“通用派”和“垂类派”的路线之争
若从另一个视角审视今日我国AI领域,我们会发现除“互联网派”与“AI科技派”外,还存在着大模型开发类型的竞争。观察这些公司推出的大模型,我们可以根据其目标受众、应用领域以及适应场景的差异,将它们划分为通用型与特定领域型两大类。因此,诸如“通用派”与“垂类派”等企业群体应运而生,它们分别采用了不同的一个大模型开发策略。
对于那些专注于开发通用人工智能大型模型(通识大模型)的企业来说,其核心目标在于构建理论框架、开展大规模模型的训练以及优化算法等方面。这类大型模型的应用场景覆盖广泛,目标用户群体也相当丰富。简而言之,这些从事通用大模型研发的企业,实际上是在进行通用人工智能技术的突破性研究,旨在打造具有我国特色的ChatGPT。
对于那些专注于开发特定领域大型模型的公司来说,他们的主要目标是利用深度学习来解决行业特定的问题,产品的开发是他们的核心任务。具体来说,他们会利用自身在某个特定领域的专业知识和技能,开发一款针对该领域的ChatGPT,然后将其应用到自身的AI产品中,从而提升或者强化这些产品的特定功能。这种特定领域大型模型的构建,虽然相对于通用的一个大模型,在算力的需求上可能会有所降低,但是,由于其针对性的较强,对于数据的需求以及算法的优化都会更加深入和细致。
由于在用户群体规模体量和应用场景适用范围上,通用大模型都要远远大于垂直应用类大模型,所以其开发周期和所需要投入繁荣财力、人力也远高于垂直应用大模型。因此,目前国内做通用大模型的企业,基本上都是互联网或科技大厂。像百度、阿里、华为等这些互联网大厂和科技巨头,就是属于“通用派”系。
而就内容反馈数据来说,相较于通用大模型,垂直应用大模型生成的内容更符合特定垂直类场景的需求,质量更高。因此,也就吸引了众多AI科技企业参与其中。如深兰、出门问问、有道等聚焦AI具体赛道的企业,就是典型的“垂类派”企业。
就目前市场关注度而言,由于受Open AI成功开发ChatGPT并迅速走红的影响,国内社会各界把目光大都集中到“通用派”企业和大模型上来,相反“垂类派”企业和产品却受到了冷遇。
显然,ChatGPT的成功,正在潜移默化地引导着国内AIGC产业发展的走向。
诸神混战之下,谁主沉浮?
那纵观这些参战的企业,到底谁能在这场“大模型混战”中存活下来,并最后拔得头筹?先后竞相登场的那些大模型,它们的未来会是星辰大海,还是一地鸡毛呢?下面我们就来盘点一下。
首先,来看目前市场上曝光率最高的大模型四巨头“BATH”,即百度的“文心一言”、阿里的“通义千问”、腾讯的“混元”和华为的“盘古”。这几个大模型有以下几个共同特点,那就是都布局了NLP、CV、跨模态,适用范围和对标人群都很广,且都动用了海量数据参数进行了预训练。
但这也导致了这四家的大模型同质性太强,应用上基本没有区隔,正式进入市场后,非但难以发挥各自优势,反而极易导致“内斗”,就好比在一个“浴缸”里养了4条鲨鱼,妥妥坐实了“BATH”之名。
然后,再来看市场上已公开的垂直应用大模型。这一类模型的特点是目前已经正式对外公开的不多,名气也没有“BATH”的响,且都不是独立推出,而是附身于企业开发的某个具体AI产品上。
如有道近期推出的自研教育场景下类ChatGPT模型“子曰”,就是服务于AI口语老师和中文作文批改应用上的;而面向金融领域的AI企业百融云创,也将研发的与ChatGPT采用同源技术的智能语音机器人应用于金融行业的零售业务上;另外在4月23日举行的全国工商联物联网委员会年会暨物联网与人工智能高峰论坛期间,中新社报道深兰科技开发的国内首款强化学习个人数字化产品metamind已经应用了自主知识产权的“硅基知识”大模型…这些都是AIGC大模型在垂直应用领域的成功案例。
从市场营销角度来看,一个产品问世后,正确的市场手段是创造一个新的消费领域,以此避免自己陷入原有红海市场的竞争。这对于AIGC大模型开发应用来说,也是完全适用的。因此,像“子曰”、“硅基知识”这一类产品技术的研发,可以说是在AIGC大模型实际应用上的一次突破创新。
而从另一方面来说,目前国内市场上所出现的大小厂都一窝蜂地去做类ChatGPT产品,对整个产业发展而言,并不是一个好的现象,只能说是脱实务虚,其中绝大多数企业应该是走不远的。就以“BATH”这四巨头而言,最终也很有可能陷入内耗式竞争。相反,企业如果能集中力量,聚焦某个具体应用领域,开发垂直应用大模型,也许会有意想不到的收获。
就以“硅基知识”大模型为例,不同于传统意义上的类ChatGPT大模型,“硅基知识”是专为深兰个人数字化产品Matemind研发的,具备内容生成、记忆和发现三大功能,不仅能智能生成内容,还能将所生成的内容转化为用户个人记忆整体保存下来,作为“数字分身”基础数据,以备未来生成新内容和延续个人“硅基生命”所需,有效解决了个人数字化所必需的数字分身在知识学习、积累和应用方面的问题。
简单地说,“硅基知识”不仅实现了人生命的“数字化永生”,还指出了一条人工智能产业发展的新路。透过“硅基知识”大模型这个案例,我们甚至可以说每一款垂直应用大模型,都是一盏点亮人工智能产业发展新方向的明灯。
搞大模型,瞄得越小,做得越好
自从进入21世纪以来,我们分别经历了互联网热、电商热、大数据热……每一次热潮开始,都会引得各方都争先恐后地涌入,但潮水退去之后,就会发现当时那些蜂拥融入的弄潮儿们,绝大多数都不知所踪,真正活下来的都是那些默默耕耘,在某个具体领域做出成绩的企业。
那面对大模型混战愈演愈烈的今天,中国企业应该如何参与其中?在我看来,做大模型既要看准大方向,也要瞄准小目标,切忌贪大求全,只有这样才不至于重蹈以前那些失败者的覆辙。
百度的李彦宏就曾表示,ChatGPT作为一个通用模型,对于某些特定领域并不擅长,而大公司一般都从通用型产品开始做起,初期他们并不会特别关注某个细分垂直领域,但当你在某个细分领域内做到极致,你就会发现你的产品和所积累的用户需求,很难被其他产品直接复制,此时你再去拓展应用领域,就会比较有竞争力。
钱学森在《系统工程论》提出这样一个核心观点,那就是做任何技术产品,都要从现有条件出发,不求单项技术的先进性,只求总体设计的合理性,充分利用现有资源;以总体设计负责对各个分系统的技术协调提升改造现有的工业技术。把这个理论放在大模型的开发上,一样适用。大模型再厉害,也只是一项技术,它必须应用到具体产品上,才能发挥最大作用。因此一个企业做大模型,并不是做得越大越通用就越好,而是应该基于产品,聚焦在某个需求上,合理开发和利用,进而实现大模型在产品中功能的最大化。
不跟风,坚持做自己,保持一颗平常心,这一点对所有涉足中国AI领域的企业来说,都尤为重要,无论你是否参与了这场混战。
做AIGC大模型本身就不是一场百米赛,而是一场马拉松,比拼的不是看谁眼前跑得快,而是看谁今后走得远。无论是百度、阿里、腾讯这些互联网巨头,还是商汤、科大讯飞、出门问问、深兰科技这些AI赛道能手,谁能走到最后,关键还是看谁现在的做法对头。
因此,有必要在这里泼泼冷水,让大家都冷静冷静,千万不要盲目跟风,被ChatGPT引燃的这股通用大模型“虚火”,给引火烧了身。(本文首发钛媒体APP)
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!