国内ChatGPT为何未能快速追上ChatGPT?揭秘强人工智能与弱人工智能的差距
文章主题:
🎉 ChatGPT热潮已过半年,国字号ChatPals接踵而至,创新竞相涌现!然而,尽管技术日新月异,目前市面上的产品大多仍停留于AI初级阶段,距离引领潮流的全能型ChatGPT尚有一段路程。国内厂商为何在学习速度上未能展现出一贯的敏捷呢?🤔 这背后的原因值得深思。
2022年11月,OpenAI的一记“惊雷”点燃了国内外巨头的竞争欲。
🎉 ChatGPT热潮来袭,首批国内产品已华丽亮相!🔍 然而,尽管百度的”文心一言”首开先河,引领了这场技术风暴,其他如360、阿里和科大讯飞等巨头也不甘示弱,纷纷加速研发。然而,市场反应似乎并未如预期那般热烈,产品表现略显低调。🤔 这场人工智能竞赛的初期,各家的表现都显得有些保守,期待后续能有更多惊喜!💡
🌟ChatGPT的崛起,无疑是人工智能语言技术的一大里程碑,它以其卓越的模拟人类对话和高速学习能力震惊了世界。无论是在微软工程师的严格测试中还是展现出撰写学术论文的实力,都彰显出其无与伦比的语义理解深度。然而,国内同类产品的表现似乎并未跟进,让人不禁思考:为何ChatGPT能独领风骚?🤔尽管如此,我们不能忽视的是,每个品牌都有其独特之处和待提升的空间。国产ChatGPT们或许在某些方面还未能达到国际水平,但这并不意味着它们没有潜力或价值。毕竟,创新和发展需要时间,技术的进步永无止境。💪对于用户来说,重要的是选择那些不断优化、注重用户体验的产品,而非一味追求最初的好奇和热度。让我们期待国产ChatGPT们能迎头赶上,为中国的AI语言市场注入更多活力与可能。🌈
为什么国产大模型,这一次没有追上ChatGPT?
现实差距
国内的AI机器人、AI识图技术已然“炉火纯青”,相关产品也曾一度风靡海外。
🌟掌握未来家居潮流!🚀通过AI驱动的创新力量,诸如智能机器人和图像识别技术,我们构建了一套完整的人工智能解决方案,它们以’弱智’之名,却能展现出强大的智慧。👀这些设备不仅能流畅应对日常问题,如快速响应指令,还能无缝连接各类家电,协同打造智能化的生活空间。🏠想象一下,一键操作,家居尽在掌握,这就是未来智能家居的魅力所在!💡SEO优化提示:使用”人工智能家居系统”、”弱人工智能优势”、”智能家居体验”等关键词,提升搜索引擎可见度。
🌟ChatGPT引领AI新纪元🔍,它以强大的生成能力颠覆传统认知。只需简单指令,无论是编码逻辑 stron göđ️还是学术论文结构严谨,ChatGPT都能信手拈来。不仅如此,它的创造力不容小觑,能跨越领域边界,从文学创作到艺术想象,一切皆有可能。但别忘了,它并非无脑“胡说”,而是基于海量数据和深度学习的智慧产物。🚀
🌟人工智能并非专属人类的专利, 它的能力早已超越了简单的”胡言乱语”。🚀周鸿祎的观点或许反映了AI的强大潜力,它不仅能全面接管弱智的职责,还能在复杂领域展现出超乎想象的智慧。🔍强人工智能的存在,无疑正在重塑我们的认知边界,开启一个全新的技术时代。🏆
也就是说,ChatGPT的诞生,完全可以倾覆弱人工智能的全部成果。因此,ChatGPT才会引起全球科技巨头的警觉。
而当下国产ChatGPT产品形成于“临时抱佛脚”,带有很重的弱人工智能“影子”。
由此可见,从弱人工智能到强人工智能并不是一次简单的“复制粘贴”,而是一次重大的科技飞跃,甚至可以被评价为时代变迁的开端。
体系互异
一个从大环境角度出发的答案,是两国的创新机制不同。
具体而言,ChatGPT是典型的硅谷式创新产物。清华大学公共管理学教授梁正表示,这个创新生态体系有几个关键的步骤,首先要有创新性的机制,一些企业聚集了一批理想主义的技术天才,走了一条不寻常的道路,最后再由大公司进行投入和资源整合,完成商业化。
在这个过程中,隐藏着三个体系:一是研究型大学,有一批科学家在做探索性的工作;二是使命导向的实验室体系,以国家的使命驱动前沿研究;三是硅谷,基于创新创业和风险投资的商业生态。这三者相互叠加,密切联动,先从0-1突破,在通过大公司注资完成从1-2的工作,从而形成从科研到产业化的良性循环。
ChatGPT的诞生,就是微软重金投资了一家看起来非同寻常的公司——OpenAI,这家公司曾经无产品、无体系,但有一个技术天才,完成了一个又一个的构想,还受到了大资金的青睐,十年后,ChatGPT轰动了全球。
而国内的创新体系大致为,高等学府中的科学家做探索性的工作-这些科学家被高薪聘请到大公司-最后以大公司为背景,对这些探索性研究成果进行投入和落地。
这种体系很稳,且我国在人工智能方面的研究看似也从未停歇。早在2018年,中国人工智能方面的论文在总量和被引论文数量上就排在了世界第一,专利数量排名第二,中国人工智能企业数量位列世界第二,中国人工智能领域的投融资占到了全球的60%,成为全球最“吸金”的国家。
然而,尽管我国人工智能相关论文数量已经形成了一定的规模,论文被引用的次数也颇多,但距离真正的成果还有一定的距离。
不单是研发差距,风投的投资思维差异也是影响创新积极性的因素之一。国内的风投思维仍是“不投没谱的事情”,根据梁正教授的说法,巨头们可能不愿意做获利前景太远的事情,很少有人像微软一样,会押注一家“非盈利”的小公司。
一项倾覆世界的研发成果诞生,可能还需要很多个“临门一脚”才能完成。OpenAI为做出ChatGPT也耗费了大量的人力、物力、财力和时间成本。因此,国产大模型想要赶超ChatGPT,尚需时间。
语言殊途
除了环境因素,摆在国产大模型面前的还有现实因素。
相关学术论文显示,ChatGPT是融合了Transformer和强化学习两项技术。
拆分来看,所谓Transfoemer架构是一种基于注意力机制的神经网络架构,被广泛应用于自然语言处理领域。这一架构能使得ChatGPT能够通过分析输入的语料来理解人类语言的语法、语义,并按照语法生成流畅且拥有较强理解力的应答。
在此基础之上,ChatGPT使用的强化学习技术,通过外界设定的奖惩规则,自主学习,最终在某项具体任务中达到甚至超越人类的表现。
强化学习模型最知名的应用就是DeepMind团队开发的围棋机器人AlphaGo,其在2017年打败了人类最顶尖的骑手柯洁。DeepMind团队还开发出另一项颠覆性的研究——AlphaFold数据库,在蛋白质结构预测上远远超越人类,并在2022年宣布预测出地球上几乎所有的蛋白质结构。
简言之,就是ChatGPT需要先理解人类的语法、语义,再通过收集大量资料、不停完成训练、反复学习才能够达到当前类似于人类,甚至超越人类的表现。
而国产ChatGPT在这两项技术方面都略逊一筹,一方面是数据库容量,而更重要的是中、英两种语言结构的天然差异。
当前的ChatGPT是基于英文的,英文能够让ChatGPT通过词缀、词性、标点符号等,更加方便的将相同词缀的词汇构成并列。如以ing结尾的词汇,可以被ChatGPT快速并列为进行时态的词汇。而中文的正在进行时表达则相对多元。
另外,英文句子的结构是网状的,理论上,在语法正确的情况下,一句英文可以由一万个词汇组成,一个句子中能够有N个谓语、非谓语、从句等等。
反观中文,一些词汇能当动词也能当名词,一个词汇的褒贬含义还需要结合上下文理解,标点符号代表的含义也多有不同,学习起来并不容易。
除此之外,强人工智能代表的是人类知识的集大成者,而大多顶尖的学术类论文、文献、资料等都是英文。这也意味着ChatGPT的学习知识库远比国内的大模型要丰富。
芯片掣肘
先天条件遇到门槛,硬实力还遭遇了“卡脖子”。
据了解,ChatGPT的训练过程需要耗费大量的计算资源和时间,这需要企业具备强大的计算能力和相应的设备。
资料显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7至8个投资规模30亿、算力500P的数据中心才能支撑运行。
支撑这些算力的,就是英伟达研发的全球顶尖的A100和H100智能芯片。有声音认为,即便是部署1万块英伟达A100显卡,也要持续不间断运算10年才能达到当前ChatGPT这样的算力高度。
但目前,这两款芯片在全球具有不可替代性,而英伟达A100和H100已经被限制出口中国。
为了继续占领中国市场,英伟达已经针对中国推出了中国特供版A800,但这两款芯片存在明显的性能差距。H100芯片的中国特供版也即将研发完毕,很快就能在中国上市。但芯片上的差距总是牵一发而动全身,单个芯片功能不足造成的时间差将导致国内AI花费更多的时间解析同样的数据。
有了芯片,还需要带动芯片的超级计算机。2020年,微软购买了28.5万个CPU和1万个GPU,联合OpenAI打造了一台AI超级计算机。根据2022年的全球超级计算机排名显示,这台超级计算机位列全球前五名。
虽然,我国的神威·太湖之光、天河-2A超级计算机也挤进了前十名,但有关分析显示,这两款超级计算机主要是用来做科研的,几乎不可能用来给科技公司做AI大模型的训练。
或许当前国内的大模型还处于微创新阶段,谈赶超ChatGPT为时尚早,但在巨头们的百舸争流下,有望形成两强格局。
责任编辑 | 陈斌
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!