清华教授陶建华:GPT不能称之为技术革命|科学多面体

AI老师 5个月前 lida
55 0 0

清华教授陶建华:GPT不能称之为技术革命|科学多面体

出品|搜狐科技

作者|郑松毅

编辑|杨锦

在百年未有之大变局的当下,科学技术作为推动经济社会发展的第一推动力,她的每一次革新都为大众瞩目。搜狐科技《思想大爆炸-科学多面体》栏目,力图展现不同视角,争鸣基础科学和前沿科技领域的重大进展与突破。

GPT拉开强人工智能时代的序幕后,“学院派”“大厂派”“创业派”争上大模型,到底有没有必要投入重金做自己的大模型?ChatGPT能称得上技术革命吗?围绕这些热点问题,本期对话清华大学教授、国家杰出青年基金获得者、国家级领军人才陶建华。

嘉宾简介

陶建华,清华大学教授,国家杰出青年基金获得者,国家级领军人才。主要从事智能信息融合与处理、语音处理、情感计算、大数据分析等方向,在国内外主要期刊或会议上发表论文400余篇,已授权发明专利108项、美国发明专利14项,并完成多项国家和国际标准,研究成果多次在国内外学术会议上获奖。

划重点

1. 不鼓励所有人都去做大模型,或将造成算力、电力等资源浪费。

2. 大模型具备多模态功能集成化的强通用性,对于人脸识别、语音识别等不同任务可一并解决,避免了人工智能“碎片化”引发的种种问题。

3. 建议用“突破性的技术进展”来形容GPT更为恰当,“革命”应当是完全颠覆性的创新,而GPT用到的语言模型是较早前就有的,不能被称为革命。

4. 大模型的应用领域远不止AIGC,还可用于数据关联、信息查询等。

5. 在算力没有得到明显增长的情况下,不追求参数的持续增长是一个阶段性的考虑,更多的还是应该考虑如何优化现有的模型。

6. 鼓励年轻人更多的在基础层面上认真探索,相对不急功近利是十分难得可贵的品质。

在OpenAI吹响人工智能技术突破的号角后,不断涌起一波又一波的科技发展浪潮,全球企业、院校也纷纷跻身于此。从早期的单一模型到现在通用性更强的人工智能大模型,人工智能技术正在不断演化和发展。

据搜狐科技不完全统计,目前国内各派大模型主要玩家总和已40有余。对于大模型发展的不同观点也引起业内大佬们热议,其中包括“是否应建立自己的大模型”“是否应追求参数持续性增长”等话题,不同的声音从四面八方传来。

陶建华认为,人工智能大模型是一定要做的,因为它体现了人工智能技术发展的一个重要趋势,是一种非常直接推动实际应用的技术方向。他表示,大模型就像PC时代的操作系统,很可能会成为未来人工智能技术的一个重要的基础平台。

从大模型特性上来看,它具备多模态功能集成化的强通用性,对于图像识别、语音识别等不同任务一个大模型就解决了,避免了人工智能“碎片化”引发的种种问题。

从技术角度来看,参数规模的不断提升,并在这个基础上持续优化,是人工智能大模型得以发展的关键因素。

对于OpenAI创始人山姆·阿尔特曼近期表示“下一阶段不会以持续增加参数为发展方向”的观点,陶建华分析称,这是受算力限制的一个阶段性考虑。

谈及GPT是否能够被认定为技术革命,陶建华建议用“突破性的技术进展”来形容它更为恰当,“革命”应当是完全颠覆性的创新,而GPT用到的预训练语言模型技术是较早前就有的,不能被称为革命。

陶建华强调,大模型的真正应用远远超越了AIGC领域,比如做数据关联、信息查询等。

以下为对话实录(经整理编辑)

搜狐科技:您认为大模型是一定要做的吗?为什么?

陶建华:我认为做大模型是很有必要的,它体现了人工智能技术发展的一个重要趋势,是一种非常直接推动实际应用的技术方向。大模型具备多模态功能集成化的强通用性,对于图像识别、语音识别等不同任务一个大模型就解决了,避免了人工智能“碎片化”引发的种种问题,或将节省人力、时间等成本。

大模型的实际应用远不止AIGC领域,还可延展到数据关联、信息查询等。

搜狐科技:参数量增多意味着什么?大模型性能更好?

陶建华:参数量增多代表神经元的个数增多,但大模型的性能表现不仅与参数量有关,还与设计者的参数优化能力和算法设计有关。

搜狐科技:最近产业各界对大模型热情高涨,一拥而上地要去做大模型,您怎么看?

陶建华:大模型有做的必要性,但所有人都去做大模型是没有必要的,大模型对于算力及资源门槛较高,所有人都去做,在算力上也支持不起。

搜狐科技:近期OpenAI创始人表示“下一阶段不会以持续增加参数为发展方向,而是寻求其它方式去优化AI模型”,您怎么看?

陶建华:参数量持续的上涨会造成算力跟不上的问题,模型训练周期也会随之变得更长,不利于大模型的迭代发展。在算力没有得到明显增长的情况下,不追求参数的持续增长是一个阶段性的考虑,更多的还是应该考虑如何优化现有的模型。

搜狐科技:您在大模型的研究过程中遇到最具挑战性的问题是什么?

陶建华:其中一个问题是大模型在训练的过程中,迭代周期较长,像一般的行业大模型训练一次从几周到几个月不等,模型问题的分析以及算法的调优不能在第一时间得到验证,因此研发周期通常比较缓慢。

搜狐科技:马斯克近期在一档访谈节目中,提及AI再发展会完全控制人类大脑,需要及时的监管,此前也曾呼吁暂停训练更强大的人工智能,您怎么看?

陶建华:从技术发展角度来讲,以前通常认为AI真正能具备与人类相提并论的自动生成、智能涌现等能力是一个漫长的过程,甚至是遥不可及的一件事,而现在至少看到不是那么遥远,但AI控制人类大脑短时期还不会发生。

AI发展带来的重大负面影响的确需要人们及时去关注,但因此停止所有AI模型进步的脚步是不建议的,也无法真正停止。

搜狐科技:从您的研究生涯中,有哪些总结出的经验和建议可以分享给年轻的科研人员的?

陶建华:我还是鼓励年轻人更多的在基础层面上认真探索,相对不急功近利是十分难得可贵的品质。以GPT研究团队为例,很多时候当大家沉下心去做一些有价值的探索性工作时,会有意想不到的收获。当然,也很理解当下年轻人生活的压力,还是鼓励大家找好心态平衡点。

版权声明:lida 发表于 2024年4月10日 am11:06。
转载请注明:清华教授陶建华:GPT不能称之为技术革命|科学多面体 | ChatGPT资源导航

相关文章