AI在诺贝尔奖上大放异彩,事实上是在提示人类要重新思考基础学科的含义和概念。这已经不是科学研究工具的革命,而是能让科学发生一次革命的工具。其之所以能最终得到社会的认可,本质上是纵横交错的结果:纵向,即在这个时刻所有创新要素都得到整合,形成有效的创新机制;横向,则是数据、算力变得成熟,更像基础设施
文|财经智库》研究员张燕冬
编辑|袁雪
王坚像“谜”一样神奇而独特的存在。他是中国工程院院士、之江实验室主任、阿里云创始人,作为一名科班出身的工业心理学博士、教授、系主任,到微软担任亚洲研究院常务副院长,再到阿里巴巴首席架构师,以及具有国家重要战略意义机构的科技领导人,其经历横跨高校、企业、科研多个领域,这些角色看似差异较大,但它们之间却有一种密不可分的连接。
可以说,上世纪80年代“开放而超前”的杭州大学心理系奠定了他作为心理学家和计算机学家(兼修并完成浙江大学计算机系相关的基础课程)的科学家底色;而微软近十年的历练使其在紧跟世界科技前沿,尤其在大规模数据处理系统等方面打下扎实的基础;无论是采用计算作为公共服务的产业模式,主持研发大规模分布式计算系统的“飞天”以及云计算产业的突破,还是以志愿者的方式推动“城市大脑”作为未来城市新的数字基础设施,则使其完成“0到1”“1到100”的创新全过程;而在之江实验室则是其聚焦智能计算,推进高效能新型算力系统成为浙江、杭州实施人工智能战略的创新尝试,尤其在机制创新、市场模式创新有了新突破。
在杭州云栖小镇的“2050博悟馆”,王坚与《财经智库》进行了独家对话。博悟馆陈列着近百件与数据、计算和互联网相关的艺术品,还有百余位对人类作出重大贡献科学家的画像,就如他倾其全身在苦苦追索“创新究竟如何发生,尤其在决定人类命运的关键性创新,在何种条件下产生”,犹如他创办“云栖大会”“云栖小镇”“2050”的初衷,而酝酿已久的“梦溪论坛”亦初步成型,既追踪沈括,也借鉴为期两个月诞生了近代“人工智能”的达特茅斯会议。
“悟”是灵魂,“大道至简”是他认知世界的风格。
“1到100”实质是社会对技术的认可
《财经智库》:近期,诺贝尔物理学奖和化学奖分别颁发给了从事人工智能的科学家,无论是人工神经网络和机器学习的基础性发现,还是在预测蛋白质结构和计算方面,均与人工智能相关,这说明AI技术在多个领域的应用并产生深远影响,但为什么诺贝尔奖的颁奖词里并未提人工智能的字眼?
王坚:有意思吧。当今年的诺贝尔物理学奖公布后,《科学》杂志的网站上发表了一篇文章,题为“In the surprise,AI pioneers win Nobel Prize”(出乎意料,AI开拓者赢得了诺贝尔奖)。更有意思的是,《财富》杂志在介绍获奖人Geoffrey Hinton(杰弗里·辛顿)时,说他是一个认知心理学家,同时也是一个计算机科学家,所以物理学奖不仅颁给了计算机科学家,同时还是一位心理学家。有好事者跑到ChatGPT去问,Hinton的相关研究是不是属于物理学?怎么问也问不出来Hinton从事的是物理学研究。
《大西洋月刊》的报道更是直接以《AI赢得了诺贝尔奖》为标题,但同时也描述了诺贝尔奖“向善”的初衷,即诺奖的获得者要对人类福祉有贡献。在我看来,这次诺奖肯定了AI对人类的益处。曾经有人说过ChatGPT是人工智能的iPhone时刻,《大西洋月刊》的这篇文章则认为这次诺贝尔奖就像是AI的青霉素(青霉素对人类有贡献)和X光时刻。如此的表述是为AI正名。当然在全球范围内,仍然对AI有争议,但我愿意将这次颁奖称之为最好的“AI诺贝尔和平奖”。但整个颁奖词里确实未提AI字眼,科学界与媒体界强调的面有所不同,我比较同意部分主流媒体的观点。
事实上,这是在提示人类要重新思考基础学科的含义和概念。这已经不是科学研究工具的革命,而是一个能让科学发生一次革命的工具,这个新工具让科学得以进行一次彻底革命,某种意义上讲它“革”了科学的命。
《财经智库》:您在讲工具的革命和革命的工具时,将此运用于企业,记得您曾提到大公司觉得AI是工具的革命,小公司觉得AI是革命的工具。如果大公司也有革命工具的意识,那么划时代的影响就来了。您的意思是,尽管大小公司有区别,但都具备一个创新空间?
王坚:严格意义上讲,大企业是可以把AI作为革命的工具,只不过它要守着原来的利益和惯性不放,就只能变成工具的革命了。理论上都可以成为革命的工具,但在大公司中,让人们全面拥抱AI会比小公司更难。
《财经智库》:船小好掉头,大企业往往做不到。
王坚:对,做不到是因为机制原因,而非工具本身的原因。其实今年诺贝尔奖也部分反映出了这个问题,为什么不是这个学科领域的科学家来完成这些研究呢?他们还是抱着固有的思维不放。
《财经智库》:这跟你提出的“机制创新”又有怎样的关联?您说过,从AI到AI+,这个“加”不是别的,而是“机制的创新”,而机制创新不是人工智能与产业的简单结合,它完全超出了“0到1”的创新,就像OpenAI,事实上继承了源自Google的Transformer技术,但Google内部的机制难以创新,不像早期的OpenAI本身具备非营利机构的特质。您说这种超越“0到1”创新,远远超出学界、产业界已有的认知,那它对现有认知提出了怎样的挑战?
王坚:讲“0到1”时,人们往往没有把它的内涵和外延说清楚,我们总是狭隘地将此视为技术本身的革新,而技术本身的革新是0还是1,可能有一种判断的标准问题,既包含技术带来的或者技术影响的变化,也含有一个“0到1”的过程。毫无疑问,“从0到1”的创新很重要,但“1到100”的创新同样重要。1到100的创新不是简单的应用,是社会对这个技术的认可程度,这是非常艰难的过程。也就是说一个新技术的起源到最终需要社会的认可,实际上就是“从1到100”的过程。
今年诺贝尔奖可以视为科学界认可了AI,它是AI在科学领域“1到100”的创新。AI开始影响科学研究本身。所以我的明确定义就是,“1到100”是社会对这个技术认可的过程,而不是简单的再重复过程。
关键要将“机制”说清楚。“1到100”的内涵到底是什么?1到100是1被放大了100倍,而不是1重复100次。从这个意义上讲,社会接受一项新技术的过程极其艰难,人们理解AI也是这个过程。你可以说AI从1956年达特茅斯会议开始,已近70年的历史;如果从ChatGPT的出现算起,也可以说近几年才有了突破。
《财经智库》:在AI的历史纵向上,您说过虽然人工智能有很长的过去,但只有七年的历史,直到Google开始提出了Transformer,后来OpenAI推出了ChatGPT。但在横向关联性上,您也提出其中的创新就是数据、模型、算力的系统结合,以及机制创新、技术创新和基础设施的创新,这个历史纵向跟你所想的横向关联,其结合点又在哪?
王坚:它本质上就是一个纵横交错的关系。纵向,就是这个时刻所有的创新要素要能够整合,OpenAI把深度学习、Transformer架构、大语言模型,以GPT的形式整合在一起;横向,数据、算力慢慢变得成熟,更像个基础设施。比喻来说,高速公路作为基础设施,如果没有汽车、汽油及相关技术的整合,没有任何用处。因此,要在一个基础设施上进行深刻的纵向整合,世界才会被改变,谁先谁后则是另外一回事。历史源头也很重要,有的可能是先修路才有车,有的可能有了车才修路,两者之间相互作用并影响。
如何加速基础设施的创新也至关重要。设想一下,造一辆车容易,但要大规模使用,基础设施不可缺。若把大规模使用当作一个创新加速过程,就变得有意思了。
我经常被问到一个问题,到底是“0到1”重要,还是“1到100”重要?很难回答,因为这个问题需有前提和条件,哪方面欠缺它就是重要的。
《财经智库》:条件和时间不同,重要性就不同。当我们谈论pure questions时,答案是一样的,但放入不同的时间和地点或环境,答案则不同;即使同样的问题,强调的面也不同。
王坚:就是这个道理。你说对人来讲,维生素C重要还是钙重要?就看你缺什么。我始终强调判断很重要,判断不对所有东西都不对。你到底是缺钙还是缺维C,判断变得很重要。创新也是如此。举例来说,人才很重要,这句话永远都对,但今天此时此刻是哪种人才重要,不见得是一件容易判断的事情。
《财经智库》:判断与认知就会影响决策和结果。您曾经引用红杉资本的观点,在云时代、移动时代、AI时代,云计算就是基础设施。为什么基础设施作为技术渗透的一种形式对人类产生的影响是最深刻的?
王坚:为什么基础设施最重要?好的基础设施能跟随人类几百年、几千年,真正一直存留下来的基础设施没有多少,如道路,电网等,有些当时所谓的新发明,例如很多智能硬件,认为是创新,其实昙花一现。如今火热的虚拟现实,最后不是还回到“眼镜”上吗!所以,越是能跟着人类发展,越是简单离不开的东西,才是真正革命性的东西。道路、电力等可以发生诸多形式的变化,但不会消失。
那么,云计算为什么是基础设施?计算是不会没有的。一个技术真正要追求的就是它的生命周期,世界上生命周期足够长的技术不多,云计算是少数几个可以与电等媲美生命周期的技术,因为对计算服务的需求不会消失,就像对电的需求。
我常常说自己做云计算是非常幸运的。第一,云计算是技术,技术创新是关键;第二,云计算是商业,不是每一项技术本质上都有商业属性。为什么阿里云成功,不是我有什么了不起,是因为云计算本质上就是商业;第三,云计算还是一个能够持续几百年的商业。大家对商业的理解不太一样,不能把简单的买卖当商业;市场化与商业化也不是同一概念,我们需要的是真正回归市场化。总而言之,同时兼具这三个条件,技术、商业,还能持续百年的创新,很少。
《财经智库》:您把数据、计算和云计算都视为基础设施。那未来AI还会主要依靠transformer技术,还是会有更好的技术?如果有的话,这种新技术应该有什么特点?或者比现在更优,或更好的底层?
王坚:依我之见,这次诺贝尔奖的物理学和化学奖的获奖贡献对AI的作用还是稍微差了一层意思,没有直接把AI说出来。如果真正要说AI,一定要说Transformer技术,神经网络是Transformer的基础,Transformer是非常革命性的,其革命性体现在几个方面:其一,Transformer是能够真正把大规模算力用上的一个技术框架,除了Transformer,没有其他任何技术框架和方法能够利用如此大规模的算力进行训练;其二,在Transformer的框架下定义了数据,它用Token变成了定义数据最基本的单元,事实上把计算和数据相融合,使其架构趋于完整。
我认为,短期内发生革命性变化,还是比较难的。要不要想办法革新?当然要。但如果有人今天说有东西会马上颠覆Transformer,我也表示怀疑。计算机会不会革命?一定会,毋庸置疑。但我基本认为20年之内是不可能的,我们到今天还是依赖冯·诺依曼结构。
《财经智库》:您有没有觉得Transformer这个革命性技术有弱点?
王坚:我可能鼠目寸光,我更愿意看到它的长处。这就如同对待一个人,他的长处还没有完全发挥出来,你却去想他的弱点?有人会写文章,你却责怪他数学能力差,逻辑是不对的。你需要先找到他的能力边界,而不是找缺陷。ChatGPT的巨大成功误导大家的地方,就是把大家的目光集中在让Transformer做ChatGPT类似的事情。事实上,这次诺奖得主预测蛋白质结构也是用的Transformer架构,但他们对这个架构做了革命性的延伸。再比如,在生成图片的Midjourney所用的技术也同样用在了蛋白质结构预测;接下来也可以用这个技术来预测天气等。在AI历史上还没有一个方法可以被这么广泛运用,目前一个很大的挑战是我们还没有把它用好。就像电从点亮灯泡到成为汽车的动力经历了100多年。而让我“着迷”的就是它还能被用在哪里!对技术也要有敬畏之心。
一个技术创新会有巨大的社会成本,创新也要符合经济规律。如果创新的成本代价超过其社会价值,这个创新可能就会失去意义。从产业角度,一定要搞清楚科技创新给社会带来的效益能否覆盖其成本。
创新的本源:密度+强度+加速度
《财经智库》:云计算的概念最早可以追溯到1961年,当时科学家John McCarthy(约翰·麦卡锡)提出了一个想法,即计算能力可以作为一种像公共事业服务来提供,用户可以像使用水电一样按需使用资源,但是这个概念在当时的技术条件下并未得到广泛发展。
王坚:约翰·麦卡锡是很有意思的一个科学家,他是达特茅斯会议的十个人之一,且是主要发起人,他也是提出“人工智能”概念的人。计算要像公共服务那样也是由他最早提出,随着万维网的出现和20世纪90年代末到21世纪初互联网技术的发展和普及,计算作为服务这样的思想逐渐成熟,多家公司如亚马逊、谷歌、微软开始探索提供基于互联网的计算服务,这些服务后来被称之为“云计算”。
这就是为什么说云计算本质属性是服务。当年电就是服务,因为没人买发电机了。电在英文里被归为Utility,这个词在中文里很难找到对应的词,但本质上Utility就是服务,而且是一个不可或缺的服务。约翰·麦卡锡就提出了计算会变成Utility,这也是公共服务的意思。
《财经智库》:所以,您提出云计算是“公共云”的概念,您说私有云没有未来。
王坚:对。从这个角度上讲,是一脉相承的。但我们在中文语境里很少人会理解Utility,我当时痛苦了很长时间。如果以后云计算也是Utility,实际上就是一种公共服务。我的书《在线》翻成Utility cloud,这是cloud的方法论,即公共服务。
《财经智库》:美国云服务产业当中,是公有的订阅制为主?中国现在是以定制项目为主,这两种不同的模式又会产生怎样的影响?
王坚:你问了两个不同问题,要分开讲。美国有公有云和私有云,里面有两个不同的概念,说公共云的,像亚马逊、微软、谷歌这些公司;私有云的倡导者是IBM、Oracle,传统厂商较多。美国标准研究所妥协了一些产业之间的关系。我经常讲,一定要搞清楚什么是产业的变革,什么只是产业的妥协。在全球,大家的共识是公共云是产业的变革,私有云是产业的妥协。中国要作好这个抉择,中国本来传统的IT基础就很弱。
一个产业的诞生有其特质,不能妥协,妥协就失去了一次创新机会,但要活下来是可以妥协的,先活下来再谈创新。若妥协不影响创新,那就可以妥协;但有些妥协会影响创新,那就不能妥协。当时做阿里云时,我们就有这方面的思考,做了一些艰难的选择,否则没法做事,无法生存。
《财经智库》:但这些妥协不能影响它根本性的变革。变革与妥协,很深刻。您将云计算都视为基础设施,那云计算的“云”如何看待?互联网时代的云计算与AI时代的云计算有何区别?
王坚:应该把云计算的“云”视为方法论,这是云计算对其他产业的贡献,即不同的问题都可以用云的方法论来解决。云计算把“云”的方法论用到了计算上。
这个方法论有两个特点:一是规模效应;二是服务特性。云计算事实上是个服务的概念,规模和服务是其重要特性。规模,意味着它肯定不是一台计算机,服务则是说它不需要计算机,只需要用它的算力就行。过去用算力需要把计算机买回去,现在则是买算力即可,这是最基本的变革,就是服务特性。
互联网时代的云计算,算力硬件是CPU提供的;AI时代,算力硬件是GPU提供的。理论上,GPU能干的事情CPU都能干,本质区别在于GPU一天的算力,使用CPU可能需要1万天,在事实上就变得不可行。换言之,产生算力的来源不同,算力的大小就有质的不同。
《财经智库》:其结果也不同,也就是说云计算的规模发生了巨大的变化,量变引起质变。您刚才提到云计算是方法论,并没有用“工具”一词。
王坚:为什么是“方法论”而不是“工具”?规模很重要,任何东西都要考虑规模,这是非常重要的一个方面。某种意义上讲,今天GPU更加需要这个方法论。IT时代,很少听说谁要用一万台机器;但在AI时代,大家都说需要万卡,因为人工智能说的每张卡本质上都是一台计算机,强调的就是规模效应。
《财经智库》:规模效应,Scaling Law是这个原理吗?
王坚:规模和Scaling Law是两个有关联却不同的概念,规模带来的量变和质变在很多方面存在,但内涵不同。规模效应是最基本的约束人类发展的自然规律,而Scaling Law是专门特指大语言模型的规模效应,如计算成本,规模越大成本越低,这也是规模效应,但不是Scaling Law。大语言模型的规模效应本质上是参数规模,并产生一些特殊的现象,指的是模型参数的规模效应。
《财经智库》:那么IT时代的云和AI时代的云有何异同?AI时代中国云服务的模式和路径应该是怎样的?
王坚:很难说,但我将此具象化一些。事实上,AI时代给中国的云计算又创造了一次发展机会。某种程度上说中国的IT发达程度与美国仍有一些差距,特别是中小企业IT普及率相对较低,一般企业并不迫切地一定要“上云”。规模不需要,就很难改变这种现状。但到了AI时代,规模效应成了必须,这是机会。
我每次讲到阿里云的发展都会强调全球化的重要性。云计算技术的服务应该越来越全球化,总讲国内的大语言模型在中国用,这是有问题的。越是在全球范围内使用的技术,对云计算的要求就越高,这给我们提供了提升云计算服务能力的机会,实际是准入门槛更高了。阿里云以前在世界排前三,现在又变成第四名了,前面是亚马逊、微软和谷歌。撇开其他因素,纯粹从市场技术因素来说,说明我们的人工智能没有赶上,因为人工智能算力在整个云计算算力的比重被大大提高了。对阿里云来讲,既是挑战也是机会:能否在人工智能上有一次大提升,赶上了就有可能变成老二,赶不上就会跑到后面去。
其中还有两个原因,一方面是算力不够,另一方面则是没有用好已有算力。我在刚结束的“上海人工智能大会”上讲了一个不等式:就应用而言,相对已有的大模型,我们应用做得不够好;相对已有的算力,基础模型做得不够好;相对已有的电力供给,算力的规模还不够大。所有面临的问题都要在动态中解决。
《财经智库》:大模型时代,许多端到端的数据成为可能,作为阿里巴巴最早的首席架构师,阿里云是否会进行组织架构的调整,战略是否也会相应调整?
王坚:战略就是要成为一个服务全球的云计算公司,不服务全球市场就没有希望。比如在今年法国巴黎奥运会上,阿里云本质上就是展现服务全球的能力。技术能力是前提,同时一定是在服务中提升自己。人们总愿意将问题的原因简单归结为生态,但实际上能力一定是与高手的过招中形成的,生态也是过招“打”出来的,在“打杀”过程中练就过硬武功。关起门来,练就不了“武功”,生态更无从谈起。中国走出去的过程,既是高手过招过程,也是能力提升的过程。
《财经智库》:您认为阿里云在全球的服务方面,还可以步子迈得更大?
王坚:在这方面,阿里云刚刚开始,甚至可以说“开始的开始”,但从云计算角度,阿里云是中国企业唯一一家真正迈出去的企业。李强总理在上海人工智能大会期间巡馆时,到了阿里云展台,我主要报告了两点,阿里云既是全球服务,也是全栈服务。所谓全栈服务,就是别人在我们上面用我们的云计算服务,只要关注应用本身就行。全栈服务听起来很抽象,比喻说你买一双鞋,也同时必须有鞋带,换成云计算服务就是要提供最基本的系统服务能力。但也不能越界,若卖鞋的人把穿的袜子也绑死了,那就做了别人的事情。阿里云要做的就是保证全栈服务,但又不越界去做别人的事情,这就是生态,任何核心能力都是有边界的。
《财经智库》:您作为阿里云的创始人,实现了从“飞天”技术平台到云计算产业的突破,您觉得在AI时代杭州还会再出现一个阿里云吗?
王坚:是否在杭州,是否可以用阿里云来对比不好说,但我相信中国还会出现一个现象级的技术企业。越是变革的时代越会出现这样的现象级企业。如果没有出现现象级企业,那就是不够革命的技术。所谓现象级不一定是公司的大小,OpenAI就是一个现象级公司,但它现在算不上有多大规模。
美国已经出现了现象级公司,在中国有那么多创业公司,迄今在AI领域还没有一个现象级企业。
《财经智库》:您谈到了在现象级公司方面的一些差异,那中美现在人工智能在技术产业的发展方向有什么异同?社会上总愿意问到底中美AI技术距离是拉大了还是缩小了。
王坚:对于中美科技的差距,维度不同,答案就迥异。如果仅从论文研究角度看,有两个答案。答案一,中美差距只有三个月——基本上美国人做出来的东西,我们三个月都能做出来;答案二,差距有30年——就是美国不做,我们或许永远不会去做。不过这与其说是答案,不如说是反思。强调“0到1”的创新针对的就是这个问题。
从产业角度,我们更需要从技术迭代的视角来看。其实,中美距离拉大还是缩小,根本上是一个“动态”而不是“静态”问题。以OpenAI为例,从前谷歌比OpenAI要领先得多,而真正产生突破却在OpenAI。对于科技创新而言,“加速度”才至关重要,有加速度即使落后也能赶上,没有加速度即使先进也会落后。
人才的多少也是同样道理。OpenAI只有600人,谷歌对应的有几千人,而到最后人才的“密度”决定创新的成败。OpenAI就是人才密度高,谷歌几千人各自为政;还有就是科研的“强度”,没有强度,什么都做,最后什么都做不出来。OpenAI的故事是一个很好的案例,人才密度加上科研的强度,创新加速度就出来了。
创新过程中,我们需要问的是,人才密度够不够?科研强度够不够?创新的加速度够不够?否则就会陷在旧有圈子里兜不出来。所以我们需要反思,与其问中美有什么差距,不如想想我们能不能走得更快一点。
《财经智库》:你说AI竞争除了中美两家,欧洲也在异军突起,你觉得大家各自在战略上有什么不同?中国如果想在短时间或中长期形成技术优势,需要怎么做?
王坚:我确实不能谈战略上有什么不同,只能试着给你表述一下。我们总是盯着中美竞争,实际忽略了世界上正在发生的事情。人们经常谈论的人工智能三巨头或四巨头中,他们中有两人今年得了诺奖。四人有六个国籍,其中有两人有双重国籍,但只有一个国籍是美国,主要是法国、英国、加拿大,从这个角度上讲,美国都不在这个圈子里。但本质上讲,美国高明地用好了全球人才资源。欧洲之所以会出现Mistral模型,也是用好国际资源的案例。今天的世界就看谁能把国际资源用好,国际的资源配置至关重要,我们应该理性认识其关键性。
另外,我们简单说只有中美竞争也是很静态的看法,从科技竞争的角度讲,科技的流动性变化更快。美国科技的快速发展也是二战后起来的。我始终有个观点,美国根本不是靠“0到1”的创新立国的,它是靠“1到100”的创新立国的,然后靠“0到1”的创新保持领先地位。这是一个动态的过程,跟发展阶段密切相关。
如果不是动态看问题,道理就变得僵化。即使有非常严格对于数据的监管,Mistral仍然在欧洲横空出世,也是欧洲少数几个在世界上站得住脚的大模型,而中国是否有能与其抗衡的模型还难有定论。中国肯定有自己的优势,但盲目会让我们付出代价,警觉比盲目要好。警觉不代表悲观,然而不警觉肯定是错的,盲目更不可取;但警觉也不能变成自卑。最糟的就是没有警觉,盲目迷路。
谈到国际,我还是要强调中国科技企业要在世界领先,不走向世界是没有希望的,同时也是我们对全球的贡献。就像当初阿里云讨论是否要有国际业务,我的态度非常明确:“阿里云如果没有国际业务,阿里云现在关掉就好了”。国际业务不仅仅是要拓展一个市场,而是必须走的一条路,是道路选择问题。中国企业国际化的一个难点在于,巨大的市场让企业很多时候只依赖中国市场就可以活下来,少了一点动力。如果不走向国际市场,能力就会被削弱,而科技企业的能力往往也是国家综合能力的体现。
AI应用:认知+创新过程
《财经智库》:很好奇,您就像谜一样神奇的存在,每个人都会碰到自己认知的边界,您是怎么打破知识局限完成其转化的?创新,有些方面肯定不是自己固有的领域所熟知的,除了自身学习,也有聘请更有能力的人来合作,怎么突破自己认知上的边界?
王坚:这个超出我可以回答的能力,对我来讲是自然而然发生的。人的知识有两种,一种是可以说清的,另一种是说不清的,或者说是生命中与生俱来的。但有一点可以肯定,我不是一个简单从书本上找依据的人,当然我也不是一个不读书的人。
瑞士有位著名心理学家让·皮亚杰,研究发展心理学,尤其是研究儿童心理发展,他的认知发展理论成为这个学科的典范。他将人的知识结构分成两种:同化和顺应。“同化”是把新的东西纳入旧有的知识结构里;“顺应”是当接纳新知识时,重构原来的知识框架来适应新的环境和状况。顺应是让人去适应新的知识,而不是知识来适应你。我肯定“顺应”的体会多一点,不会简单地把新东西纳到原来的知识框架里,更不会让原有的知识约束我。
《财经智库》:事实上是重塑,新的知识在你旧有的框架下重新组织,形成新的认知框架。人类的“认知”概念来自心理学?
王坚:Cognition(认知)是心理学的概念,人类较为高级的功能或心理活动都叫Cognition,这个认知跟哲学的认知不是同一含义,而是与记忆、注意、学习等都有关联,没有一个跟“注意”没有关系的“记忆”,也没有一个跟“记忆”没有关系的“学习”,整体就被称之为认知。
《财经智库》:最近诺贝尔物理奖得主说,记忆不是一个简单的重复,而是一种重塑,与您刚才讲得有些接近。
王坚:为什么称之为“重塑”?记忆就是重塑神经元之间的连接。记忆的偏好,就是神经元之间相互链接的关系改变了。而对于今天的大语言模型来讲,就是权重发生了变化。
《财经智库》:您是一个能把复杂问题简单化的人,这也是人类认知的最高阶段,有穿透力的洞见之人。
王坚:不能把问题复杂化,深入浅出,就是大道至简。浅入浅出没有价值,浅入深出很糟糕,而深入深处大家都搞不懂。深入浅出是最好的一种组合!
《财经智库》:前一段在杭州调研,走访了60余家企业,也去了阿里云。调研中发现AI的应用依然是个难题,尤其在企业和产业应用中,是普遍存在的问题,你觉得最大的难点是什么?诺贝尔物理学奖和化学奖让人看到AI应用的潜力和前景,但在“百模大战”的环境下,“应用”依然是问题,你认为中国产业和科技的衔接上突破点在哪儿?
王坚:从ChatGPT看,此前很多人会简单、笼统地认为ChatGPT是大语言模型,但实际上ChatGPT是GPT+chat,GPT才是大语言模型,chat是应用场景。大语言模型很多人都在做,但为何只有OpenAI能够横空出世?除了GPT做得出色,OpenAI对Chat的认识足够深,对技术的理解也足够透。所以一件事情的发生一定是两个前提同时具备:一是对要解决的问题有足够深刻的认识;二是对技术也要有足够的认知。
这就说到了应用困难。很多人甚至连自己要解决的问题都说不清楚,如何做应用?而要知道某项技术在今天水平有没有能力来解决他们需要解决的问题,技术判断变得极其重要。OpenAI当时并不是只做了ChatGPT,而是做了很多不同领域的应用,只不过ChatGPT是最有效的。
其实,大部分人对我们今天要解决的问题本身认识不够深刻,所以AI的应用不能简单“+行业”,或者“+场景”那么简单。任何创新都是有判断,更是有代价的。
《财经智库》:关键是加什么,怎么加。
王坚:行业到底存在什么问题,而问题是否是现有技术可以解决的,如果这两点都不清楚,“+行业”就是盲目凑热闹。
ChatGPT已经把一个最基本的应用Chat做好了,接下来是什么?比如我和新加坡科技部长交流,谈到城市的问题远远比ChatGPT要复杂得多,如果能把Transformer用到城市运营或治理的优化上,其研究规模可能比现在要大得多。同样,气象预报也是如此。
现在说起大语言模型就想到ChatGPT这样的场景,但更具颠覆性的场景是在制造业、城市、新能源、生物等其他领域,尽管技术与应用的本质原理或许一样。不能简单的想象“应用”,事实上它是个创新过程。创新过程有了结果,才能把它叫作应用,在创新没有结果之前它就是过程。
《财经智库》:我们聊聊之江实验室。自从您成为之江实验室的“掌门人”后,目标更为聚焦,聚焦在了智能计算,并开始新一轮综合性改革和规则的变化。你觉得从人才、资金以及机制,之江实验室能够胜任这项工作?您始终强调机制创新的重要性,之江实验室的机制如何评估?
王坚:机制是什么?以任务为导向的实验室需要具备以大团队完成科研任务的能力,但我们以前的科研机构不太适应需要几十个人或上百人共同紧密协同才能完成的事,适合做小项目。重大科研任务简单地拆成了不能成为有机整体的小项目,一个科研任务就自然会失去其战略价值。重大科研任务需要重投入、重人才的大兵团作战,区别于学校里导师带学生的小团队机制,各自为战。之江实验室更要做到有组织的科研与自由探索的紧密结合,融为一体。之江实验室的任务要求我们既要有成建制的突破,同时又保留相对自由探索的创新,这对我们的工作提出了非常高的要求。
之江实验室慢慢找到了对浙江创新发展来讲一个很重要的机制,这是普通学校和科研机构所不具备的,我们走了一条独特的路。
《财经智库》:市场机制在之江实验室如何起作用?我们知道,政府给了实验室很多支持。
王坚:之江实验室就是政府支持的,因为它承担了国家的使命。但同时市场机制会对之江实验室的成败起很大的作用。我们必须在四个不同层面上思考机制问题:社会机制、市场机制、商业机制和信用机制。我们往往把市场化和商业化划等号,对我来讲,这是两个不同的概念。商业化,就是一手交钱一手交货,非常简单;市场化,它要符合经济学规律,但不见得一定要一手交钱一手交货;社会化,即指动用社会资源才能完成市场化的过程。社会化很重要,因为很多社会资源难以拿钱来衡量,但它对完成一件事至关重要。
之江实验室就是在社会化跟市场化之间完成了交融,也就是说,不用一手交钱一手交货,比商业化更加有时间的宽容度,但符合市场规律和经济学规律。机制理顺了,实验室就会有大突破。
《财经智库》:最后一个问题,听说有关部门正在讨论建设全国统一的算力网,您怎么看?
王坚:取决于算力网如何定义用处,因为算力有完全不同的用法。如果讲算力资源需要有个更好的共享和流通机制,这个概念是对的,这也是云计算最初要解决的基本问题。但如果是想通过算力网解决人工智能大语言模型训练的算力问题,那就需要认真推敲了。做任何一件事一定要说清究竟解决什么问题,不然很难说是对还是错。严格来讲,大部分今天说的算力网要解决的问题就是云计算要解决的。事实上,目前云计算就是最大的算力网。
责任编辑:何俊熹