揭开历史的面纱:一张张图片,讲述怎样的故事?

学会提问 2年前 (2023) lida
65 0 0

文章主题:

666ChatGPT办公新姿势,助力做AI时代先行者!

揭开历史的面纱:一张张图片,讲述怎样的故事?

文章摘要

目前法学界一直在渲染的“大数据杀熟”、“算法歧视”等这些概念,就是当前扼杀AI创新的重要方式。比如“算法歧视”,以此观念前置性介入算法,这就意味算法是完全控制下的。但算法的效果都是过程性的及动态的,如果对算法编码前置性介入,其创新根本就不可能。

面对ChatGPT横空出世及在全球引起火爆,虽然中国手机不能够在OpenAI平台上注册,尽管ChatGPT不能够在中国直接使用,但国人依然在通过不同的方式在测试或使用ChatGPT,在中国,同样掀起了一波ChatGPT测试或使用及讨论的热潮。

揭开历史的面纱:一张张图片,讲述怎样的故事?

文汇报图片

那么创建中国式ChatGPT需要什么条件?中国现有的情况又如何?

在AI技术研究及产业发展规模上,

中国具有相当大的优势

首先就中国AI技术现有的情况而言,在不少国人的眼里,近年来中国的AI技术研究、AI技术应用、AI产业的规模都在迈开大步的前进,已经达到或超过世界的先进水平。比如从规模来说,2021年底中国有7796家AI核心企业,其产值规模达到近4000亿元。从AI的研究水平来说,2021年中国关于AI研究论文的总量已经超过了美国;就AI技术专利立项来说,2022年就达400项以上,仅深圳关于AI的技术专利就达41000项以上,在2020年已经超过了美国。从AI人才的培养规模来看,2019-2021年新增AI专业高校就达260所等,再加上出国留学的学生申请AI及专业相关人,其规模非常大。

其次,ChatGPT作为一种最为先进对话式AI,它是一种AI技术驱动的自然语言处理工具,使用了Transformer神经网络架构,是以GPT-3.5大型语言模式为根基,即以大数据、大算力、强算法的方式创立。ChatGPT核心要素涉及到基础算力、大型语言模型、大数据等。目前ChatGPT的大型自然语言模式训练需要有足够规模的、海量的训练数据以及支撑运行的算力,其成本高昂,考验着国家的经济实力。

从大数据资源来看,中国拥有全世界规模最大手机用户,2022年11月中国居民就持有手机达18.56亿部之多,所以,ChatGPT在中国不仅具有丰富的应用场景,在数据积累上也具有十分明显的优势。在AI的基础模型技术上,2017年政府就制定了《新一代人工智能发展规划》,由此启动了一系列的AI重大科技项目。

就算力等基础设施来说,中国正在加速布局。《智能计算中心创新发展指南》显示,超过30个大城市正在建设或提出建设智算中心,整体布局以东部地区为主,并逐渐地向中西部地区展开。《指南》预测,“十四五”期间,在智算中心实现80%应用水平的情况下,这些城市对智算中心的投资,将带动AI核心产业增长2.9至3.4倍。但是,就当前实际使用的情况来看,中国算力的基础设施还是存在严重不足。比如,2月20日,复旦大学自然语言处理实验室邱锡鹏教授团队发布国内首个中国式ChatGPT模型MOSS,引起不少网友关注,由于瞬时访问压力过大,MOSS服务器很快就被网友挤崩溃。也就是说,中国式ChatGPT创建存在严重的算力不足。即使有些团队或和企业能够训练出中国式ChatGPT,但是要保证其有效运行仍然是不确定的。

AI技术创新需要政府改革治理监管思路

就中国式的ChatGPT创建环境来说,中国还存在以下一系列的约束条件。

首先,中国在大数据智能化收集、处理、分析、储存等方面仍存在许多缺陷。这些大数据不仅没有广泛的、自由的、公开的、快速的流动,成为让企业及居民可分享的资源(这也是中国企业数字化转型缓慢的重要原因),而是出现了无数的数字区隔。比如国内与国外的区隔,国内一家企业与另一企业的区隔、政府与企业及居民的区隔、企业与居民的区隔等,从而形成了一个又一个的“大数据孤岛”。

社会涌出的海量的大数据并没有成为可分享数据红利的资产,反之成了不少企业的负资产(大数据没有有效利用,反之要付出高成本储存保管)。比如,中国大数据还没有真正流动起来,有人就成立数字交易所,流动的大数据先是要获利,这样岂能让大数据成为国人可分享的要素资源。还有,中国的银行业和电信业的大数据利用效率之低是十分明显。再就是,就中文信息载有量来说,尽管使用中文的人口是海量的,但是估计全球以中文为载体的信息量只会在10%左右,再加中国数据流动的严重区隔,这就意味着如果以中文为载体来创建中国式ChatGPT就面临着大型模型的语言训练上存在严重的数据质量及数据上的问题。

其次,ChatGPT之所以将对人类社会产生颠覆性的影响,这意味着ChatGPT的横空出世,并非仅是一种AI新技术突破,也不能简单等同于AIGC人工智能生成技术或一种工具,而是一种大数据时代新的生态出现,一种大数据时代成熟的标志,它可能意味着一场超越互联网的产业革命的到来,它是一种生态。

而建立这种生态的核心问题就是如何创造一个AI技术能够不断创新的环境。就目前中国的情况而言,中国AI技术创新之所以与美国存在很大差距,这既有教育制度的问题,更有政府对大型技术平台企业治理监管的思路。教育制度的问题可不是短期内可解决的,估计是一个相当漫长的过程或几代人的努力。但对大型技术平台企业治理和监管的思路调整则是当前可做的事情。比如,目前法学界一直在渲染的“大数据杀熟”、“算法歧视”等这些概念,就是当前扼杀AI创新的重要方式。比如“算法歧视”,以此观念前置性介入算法,这就意味算法是完全控制下的。但算法的效果都是过程性的及动态的,如果对算法编码前置性介入,其创新根本就不可能。这就意味着不仅能够满足中国式ChatGPT创建的基本条件,也意味着即使模仿建立了类似的ChatGPT,也是无法生成有利于创新的生态。所以,中国式ChatGPT创建存在严重的制度和观念上的缺陷,这些方面都需要全面改革及反思。

(文/易宪容)

(原文刊登于2023年3月20日出版的香港《经济导报》,总3539期)

揭开历史的面纱:一张张图片,讲述怎样的故事?

本文为香港《经济导报》新媒体文章,

如欲转载请私信联系。

揭开历史的面纱:一张张图片,讲述怎样的故事?

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

版权声明:lida 发表于 2023年3月31日 pm4:55。
转载请注明:揭开历史的面纱:一张张图片,讲述怎样的故事? | ChatGPT资源导航

相关文章