揭秘ChatGPT来龙去脉,科技神力背后的数学秘密,你了解多少?
文章主题:关键词: ChatGPT, 人工智能, 计算机科学家, 热度差异
从野蛮社会到人工智能,计算机科学家吴军为你讲解ChatGDP的来龙去脉。
🎉晚上8点炸裂!🌟顶尖科学家吴军老师空降直播间,🔥聚焦AI与ChatGPT的狂热讨论!🚀通过深度解析,带你领略未来科技的无限可能。🎓想更深入?别错过这场知识盛宴,让我们一起探索人工智能的智慧海洋!👇直播地址已隐藏,敬请留意后续更新哦!🏆#吴军直播# #人工智能探索
【这也是得到AI大作战-主题月系列主题直播中的一期,文后结尾有AI大作战-主题月的详细介绍。】
Q1:
ChatGPT的出现,为什么会引起恐慌?
🔥ChatGPT火遍全球,中美舆论反差引人深思!💡虽国内热议如沸,但这股AI浪潮在美国已悄然降温。🔍回顾十年前,新兴科技在中国媒体上的热度远超彼岸,哪怕它们的根在硅谷。👀美国人对新技术的态度往往更务实,而咱们这边,老百姓却显得格外关注,这是个有趣的现象。这背后反映出两国文化差异与信息传播速度不平衡。 ön one hand, 热情洋溢的讨论彰显了我们对科技的好奇和拥抱变化的决心;但从另一面,也可能导致资源过度集中,忽视本土创新的发展。🤔好消息是,这种交流拉近了中美之间的距离,让我们有机会借鉴彼此的经验。坏消息则是,我们需要警惕过度追捧可能带来的泡沫风险。🚀无论结果如何,ChatGPT的兴起无疑提醒我们,科技日新月异,保持敏锐和平衡才是关键。🌍
🚀技术泡沫破裂:区块链热度冷却,元宇宙尚处试验 périod,而Facebook的巨额投资却未带来预期的回报。🔥ChatGPT引发了热议,有人期待,有人担忧,中国也有一部分人企图趁机浑水摸鱼,重复过去的套路。👀然而,真正的未来科技并非一夜成名,而是需要时间沉淀和稳健发展。💡让我们理性看待这些新兴技术,而非盲目追逐炒作的热度。别忘了,每一次泡沫的背后都是一次学习与调整的机会。🌱—原文改写如下:区块链热潮冷却,元宇宙探索仍需冷静观察,Facebook的巨额投资未带来显著效益。ChatGPT引发了热议,其中不乏投机心态。中国亦有部分人试图利用此趋势,但科技前行需要稳健而非短暂热度。让我们对新兴技术保持清醒头脑,而非盲目跟风。泡沫后的学习与调整,才是真正的价值所在。🌱—原文已根据要求进行了改写,保留了主要信息,同时去除了个人和商业细节,增加了SEO关键词,并使用了emoji符号以增加可读性和情感表达。
在讲ChatGPT 是什么以前,我先给大家讲一个历史故事,这历史故事你听起来你就会发笑,但是你回头看,今天是很多人的表现也是如此。
原文讲述了1503年哥伦布的儿子记录的一次航行经历,当时他们误入牙买加,面临食物短缺的问题。为了获取食物,哥伦布和他的船员不得不依赖当地的居民。然而,矛盾随后出现,一些船员因为偷窃当地物品导致当地人停止了供应食物。这段历史事件可以改写为:🌟1503年航海史上的转折:哥伦布探索新大陆的意外插曲 🌍在寻找未知的土地时,哥伦布的船队遭遇了严峻的生存挑战——牙买加的孤立困境。航行至中途,他们急需当地的食物供给。无奈之下,与当地人建立了依赖关系。然而,这段短暂的合作很快因船员的不道德行为而破裂:偷窃事件引发了信任危机,导致食物供应戛然而止。🌟关键词优化:哥伦布、新大陆探索、食物短缺、牙买加、船员矛盾、当地居民、历史事件、生存挑战、信任危机、SEO优化
🌟面对困境,哥伦布展现了他的智慧与预见性。他巧妙地利用了一本古老的万年历,这本日历上详尽记录着天文奇观——日食和月食的精确日期。在那个关键时刻,他向部落首领们阐明,如果他们不提供食物,就等同于触怒了无所不能的神明。🌟上帝的愤怒即将降临,月球将会染上红色,象征着他的惩罚。这不仅是一种警告,也是对未知力量的敬畏。🌟
当然,众所周知,当月全食发生时,地球部分遮挡月亮,映照出红色的景象,即所谓的“血月”。然而,在牙买加,这样的天文现象并非当时居民所熟知。夜晚降临,他们惊讶地发现月亮真的变红了,随后渐渐隐没。恐慌情绪在人群中弥漫,人们纷纷揣测这是神的警示。📚✨
这个部落首领慌忙去求哥伦布,承诺答应哥伦布的所有条件。哥伦布就说,好,我去帐篷里向上帝祷告,让他不惩罚你们,但是我需要一点时间,然后哥伦布就走进了帐篷。其实,进了帐篷之后,哥伦布就是拿着一个沙漏,在看那个计时。
今天咱们有天文学知识,肯定知道月全食的时间,大概也就会维持大概48分钟,到时候月亮就会重新出现。但是,这些牙买加人不知道。他们看到的就是,哥伦布从帐篷里出来,月亮也就出来了。然后哥伦布说,这是上帝已经听了我的劝解,答应宽恕你们,但是你们必须要给我们好好的提供食物。所以,当地人千恩万谢,给他们不断提供食物。
这个故事说明什么呢?月全食这件事,它的发生背后自有其原因,但是在人们不知道这个原因的时候,往往只能把这个自然现象归结为一个神的作用。而这个神,本身又是人创造出来的。也就是说,人自己创造一个神以后,然后趴在神的脚下,成为了他的奴仆。
这就是我为什么讲要给大家开《世界文明史》的课程。
其实这个文明的发展过程,就是人类不断认识自然规律的过程。我们一点点的进步,为的就是让现在的我们不再像当地的土著人那样,盲目地相信一个人向上帝祷告真的可以阻止月亮消失。我们现在知道,在日食月食的背后,实际上是开普勒行星的三定律在起作用,然后在开普勒行星三定律背后是牛顿的万有引力定律。人类搞清楚这个原因以后,对自然就不再仅仅是畏惧了,我们可以利用自然规律做很多很多事情。
Q2:
ChatGPT的技术基础是什么?
从历史回到现在,其实ChatGPT的情况也差不多,背后是一个叫做语言模型的一个数学模型在发挥作用。换句话说,ChatGPT的背后是一个数学模型。在今天,这项技术显得很强大的原因主要是三个:
第一,它用到的计算量很大;
第二,它的数据量很大;
第三,今天训练语言模型的方法比以前要好很多。
那么,语言模型是什么呢?或者说它是一个什么时代的产物?
它是1972 年,由我的导师贾里尼克(Fred Jelinek)带领团队研发的一项技术。具体地讲,是他当时在IBM带着人来完成的一项技术,是用来衡量一句话或者一个语言现象有多么的可能产生。那它有什么用?它最初的用处是做的语音识别,后来是做机器翻译,再后来是做计算机问答,也就是我们今天熟悉的回答问题。
当时它就可以做摘要,比如说举一个例子,有一篇一万字的文章,那么你怎么摘要出十句话能概括这一篇文章的内容。这对于做这个自然语言处理的人来讲,就是一个数学问题。也就是说,你的条件是什么?条件是这一万个字,然后你想得到的结果是什么?结果可能就是十句话,一百个字,然后这里头有很多种组合,你可以随便挑几个句子,也可以把有的句子拆成两段,把后面那些不太重要的修饰或者形容的部分去掉。然后,你也可以把两个句子合成一个句子,那么你在合成一段文本的时候,这个计算机就会计算一个概率,哪些句子合成在一起的概率比较大,它会按照概率帮你合成。
而我们今天看到的ChatGPT,就是这个大的语言模型,它就是会挑一个概率最大的、最有可能发生的这样一个文本来来给你看。所以总体来讲,ChatGPT生成结果的过程,是一个用大量的计算资源来计算的过程。它需要非常庞大的数据量来支撑,有很多很多的GPU(电脑处理器)。没有这些东西的话,ChatGPT是做不起来的。
而且今天这个ChatGTP,其实不光是技术,还有很多人工在背后。他们还雇了一家公司,专门负责审核ChatGPT产生的结果。比如说,ChatGPT产生了一百篇摘要,都挺好,我已经分辨不出来了,那么这些人就负责帮我分辨一下,到底哪一篇更像是准确的摘要。
那实际上,你可以看到,Chat GPT背后就是一个语言模型,而这一语言模型的技术是1972年就已经有了的。到现在,经过了五十年,现在行业内,其实大家并不觉得它是一个什么了不得的东西。在此以前,这个语言模型其实已经做了很多的事情。
提到语言模型,这个词,最初是由我的导师贾里尼克提出来的。他大概在1993年的时候到了约翰霍普金斯大学,我是1996年到这个大学,然后成为他学生。那么这个词的中文,也就是你看到的“语言模型”这四个字,则是我在20世纪90年代的时候发表论文时候创造出来的。那时,只有我们这些圈内的人知道它能做很多事,但是你不会想到说,哎?这个事后来会被热炒。
你可以这样理解,“语言模型”之于ChatGPT,就相当于开普勒的这个行星三定律之于月食。
Q3:
“语言模型”诞生之初是什么情况?
那么在发明的当时,语言模型是一个什么情况?
其实,在20世纪90年代的时候,用简单统计方法得到的模型就已经很不准确了。这就相当于,我打个比方,你观察行星,但用的是托勒密的地心说来预测,是很不准确的。所以,那时候我们开始引入了语法、主题、语义的很多信息。然后,这个语言模型就变得很复杂了。复杂之后就又带来了一个很大的问题。
什么问题?
比如,我当时做过一个很复杂的语言模型,这个语言模型当时有多少参数?600万个参数,就是说,这歌语言模型大小基本上按以这个参数来定。我那时候做的已经是那个时代能做的最大、最复杂的语言模型了。我当时是用的还不是PC机,而是20台超级服务器,然后大概算了3 个月才训练出这样一个语言模型。所以你看,它的计算量是非常大的。那么,第一版ChatGPT,它用的语言模型参数是多少呢?大概是 2000 亿个参数,大家可以看到这些年的变化。
所以,今天很多人问,ChatGPT在美国出现了,中国研究机构什么时候能做ChatGPT?其实,中国的大部分研究机构是做不了的,不是说研究水平的问题,而是因为Chat GPT太耗资源。今天的ChatGPT,可能光硬件的成本就要差不多10亿美元,这还没算电钱,所以成本和耗资是非常巨大的。所以,如果开完玩笑,问ChatGPT的最大贡献是什么,我倒觉得它对全球变暖是有很大贡献的。
所以,我想说的是,ChatGPT这件事,它的原理很简单,但是在工程上要想做到,其实是蛮困难的一件事。
Q4:
计算机擅长回答什么问题?
到了大概2010年前后,也就是13年前,语言模型能做到什么程度?我给大家看两个例子。这两个例子都是我在2014年离开Google以前做的。当时我负责的是Google的自动问答系统,就是让计算机回答问题。不过因为这个产品是英文的,所以在中文世界基本上没有太露脸。
我给你看一下谷歌回答的一个问题,为什么天是蓝色的?
你可以认看一下这个,它的回答是这样的:太阳光透过大气层到达地球时会发生折射,空气中的气体会让不同颜色的光散射到各个地方,蓝光波长短,比其他颜色折射率高,所以看上去天是蓝色的。这是当时计算机产生的一个答案。公平地讲,这个答案比我自己写一段答案写得要更好,因为要解释这现象,你要知道不少物理学知识,而且这个句子看上去也挺合情合理的。而今天人们使用ChatGPT的一个目的,就是让他回答问题。
这里面,我给大家做个拆分。
其实,我们问计算机的问题可以分为两类,第一类叫做简单问题,第二类叫做复杂问题。简单问题就是关于事实的问题,比如某某明星是哪儿人,哪一年生的,这都是一些容易的问题。因为它是事实,有明确答案。
第二类是复杂问题,这也是大家觉得 ChatGPT 非常惊艳的地方。它能整合信息,回答天为什么是蓝色的,好像它自己有逻辑一样。再有一个,就是问过程的问题,比如说我怎么烤蛋糕,你能不把一步步写下来?今天我们问ChatGPT怎么烤蛋的高,它可以把这个过程给你写得很详细,多少杯水,加多少几个鸡蛋,加多少面粉等等,它都可以告诉你。然后你根据它提供的答案,就真能烤出蛋糕,而且烤的可能还挺不错。这是大家觉得很了不得的地方。
但是你要知道,这件事,在2014年其实计算机已经做到了,而且做得很好。所以,这项技术本身并没有太多神秘的地方。
Q5:
计算机和人,谁更擅长写作?
现在,大家热议ChatGPT,还有一个原因就是觉得它能写作。比如说写一个工作简报,这是今天美国人用ChatGPT用得最多的地方。我这周干了1234567,这七件事,哎?你看我就不用自己费劲地写了,我让ChatGPT生成一个,然后再编辑一下子就可以了。
但是,计算机写作这件事,其实你说难也难,说容易也容易,我可以给你举个例子。
在2014年我离开Google之后,当时不太做编程了,不过那时候我还有一些计算资源,所以我自己在空闲时间会写一些程序,做着玩。当时呢,我就让计算机写了两首诗,大家可以读一下这两首诗。
第一首诗是个五言诗,这是用我的话说,叫做李白风格的一首诗,大家可以读一下。这首诗就是计算机自己写的。实际上,你如果读一读,这个诗里还真有一些李白的这个特点。
那第二首诗,我也把图片放在下面了,你可以看一下。
先说一下,因为古诗都有平仄一说,但是我们现在的读音当时的读音不一样,所以我们也没去管这个平仄到底合不合古,但是这个我们单从它的内容意境来讲,你读的会觉得很顺畅。
好,那么话说回来。
第一首诗怎么做的?其实再简单不过了,你就把李白的诗放到计算机里。李白诗一共1000 多首,也就一万来句话,这个对计算机来讲太简单了。它写的时候,就是把句子分拆开来,拆成两个字、三个字一组,比如“空愁”这是一组,“忆长安”这三个字一组。然后它就去拼刚才我讲的语言模型,算概率,哪个概率最大?拆完了以后,我就跟他提一个要求,说要写一首忆长安的诗,它就排列组合,生成出这个《忆长安》,实际上就是这么拼凑出来的。第二首诗稍微复杂一点。
但你知道这两个程序我写了多长时间?两天。这说明什么呢?说明你让计算机写出一些还挺像样的东西,其实不是一件很困难的事情,它没有你想得这么神秘,或者说计算机写作本身没有这你想得这么神秘。
那为什么这两首诗看起来特别好?因为这是唐诗,唐诗的格式是固定的。同样的道理,为什么用ChatGPT写周报写得好?因为周报的格式基本上是拉清单,那也是个固定的格式。包括,如果你读《华尔街日报》中文版,这里头我跟你讲,90%的内容都是计算机写的,只是你不知道。写完了以后人当然要给他一个主题,然后给它写的第一段话写个引子,然后给一个总结,起个标题,这是人要做的。为什么写财经文章比较好?因为它有好多的事实在里头,格式也是固定的,所以这件事它做起来就很好。
我花这么长时间来讲ChatGPT的背景,实际上就是想说它并不神秘,不是一个什么很高深的机器在背后。一方面,ChatGPT依靠的是一个数学模型,而这个数学模型1972年就有了,只是今天它的计算能力非常强,靠蛮力计算。那么,ChatGPT训练一次要耗多少电?大概可能是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次,这个非常花钱的一件事。
Q6:
ChatGPT对我们到底有什么影响?
那么接下来讲讲,ChatGPT对人有什么影响。
这就要回到历史上来看了,每一次这技术革命,其实它对人都会有一些影响。不过,ChatGPT它不算是一项新的技术革命,因为这我刚才讲了,这个过程很长从20世纪70年代到90年代,我们做了很多事,90 年代到现在又有很多人做了很多事。这里头最大进步其实不是这个语言模型本身,实际上是后来2000年左右产生的深度学习,使得训练语言模型能比以前准确了,不是简单的做统计。
今天训练语言模型早已经不是简单做统计了,这才是ChatGP T能产生比较好的结果的一个原因。至于说ChatGPT对人能产生什么样影响?
这个问题我先不直接回答你,我先问你,刚才给大家看这两首唐诗,你有没有发现一个什么特点?对了,这两首诗写得不错,但是你原来对唐朝了解,不会因为多了这两首诗会有更新的了解。因为,ChatGPT它某种程度上有点像鹦鹉学舌,你先要说一段话,它才能跟着学。它说出来的声音可能很好听,但是它并不提供更多的信息。
今天互联网上90%的内容都属于这一类——不提供更多的新信息,也不是原创内容,也不是自己的感悟,无非是东抄抄,西凑凑。目前,抖音、快手这类短视频,我觉得99%的内容都属于这一类,没有营养,你读完以后可能觉得挺有意思,但实际上你在上面读了再多,其实对你没有任何帮助。
如果说ChatGPT真的威胁到了谁,我觉得威胁到的就是这一类人的工作,就是说这个抖音上头那个做短视频的,或者发布一些内容的, ChatGPT会做的比他们好很多。你就想这样一件事儿,假设说,有一群人天天把那唐诗三百首里头的句子翻来覆去的捯饬,也能捯饬出一些诗,那么ChatGPT捯饬起来肯定比人快得多,所以这项技术会对这一批人会有影响。
那么,什么人不会受到影响?就是内容创造的人不会受影响。
为什么我会这么讲?还记得刚才我说的“为什么是天是蓝色的?”这个问题吗?Google为什么能回答这个问题?
因为在Google进行回答的时候,它大概把当时英语几乎所有的像样的句子都做了分析,大概有1000 亿句英语句子。那么实际上你会发现,在一些大学的网站上和那 NASA的网站上,它就有这个答案,只是我们把它拼拼凑凑,删删减减,就把它挑出来了。但是最早的物理学家做这项研究,把这个道理搞清楚,这个工作是有意义的,也是ChatCPT取代不了的。
所以,Chat GPT的工作相当于什么呢?举例子,托勒密创造出这个模型以后,那么每过一段时间,他们欧洲就会编一个大概几十年的一个日历,然后上面标上哪天有日食,哪天行星会怎么运动等等。那么人们根据这些规律,印好多本这个书,这个ChatGPT就相当于有好多本书,你拿着以后一看,说,诶,某年月日会发生月食,答案就会很清楚。但是,背后真正有意义的工作不是印这个书,而做托勒密的那个研究。
所以我认为,从历史上看ChatGPT其实不算是一次技术革命,它影响到的都是那个比较懒的人,懒得动脑筋,创造新东西的人。真正探索人类知识奥秘的人,是不会被取代的。
Q7:
ChatGPT能带来什么新的机会?
很多人问说,ChatGPT有什么新机会?坦率来讲,你没机会,因为太耗资源了,你耗不起。那么什么人能够受益?那就是卖资源的这些人。
我可以打个比方,就是说在这个加州淘金热的时候,很多人蜂拥而至,去淘金,单我们到今天为止还不知道哪一个淘金者真的挣得着钱,没一个人把名字留下来。但是最后谁挣着钱了?是卖水的人和卖牛仔裤的人。ChatGPT也是一样的道理。大家跟着一起去淘金,其实你是挣不着钱的,但是在过程中,你还不断地要买水喝,买牛仔裤穿,最后就是这两拨人挣到钱了。李维斯,就是那时候产生的这么一个公司,它就是做牛仔裤的。
那么最后你可能是给几家大的做云计算的公司在交钱,这可能是一个结果。
好了,讲完了这个 ChatGPT的历史,我给你做一个简单的总结。
第一,不要恐惧。
今天是很多人恐惧ChatGPT,就如同不要像当年哥伦布遇到的牙买加土著人恐惧月食,一样的道理。
第二,不要勉强去找所谓的机会,该怎么工作就是怎么工作。
我看有同学问我,说苹果为什么这个不做ChatGPT,我说这就对了!这就是为什么苹果是世界上最有钱的公司,利润最高,市值最多。目前,很多所谓做这种人工智能的公司到现在都在亏钱。所以,这也是为什么很多同学,有时候问关心很多太不着调的问题的时候,我就开玩笑地问他说,你的房贷还清了吗?你要没还清,你就好好回去工作,把工作做好,这才是对大家最有意义的事情,从历史上看也是如此。
第三,你要识破这些所谓的阴谋家或者想割你韭菜的人的那些把戏。
就是说,如果再来一个人假装哥伦布说他是神的代表,然后他能祈祷上天能让这月亮出来,你不要信。所以你需要了解ChatGPT背后的一些科学原理。最简单的一些原理,像今天我讲的这些,你还是需要有所了解。
AI大作战-主题月详细介绍
1. 主题:AI大作战
2. Slogan:chatGPT来袭!见高人、听高见、拿高招
3. 6门上线课程
4. 20+场大咖主题直播
ChatGPT来袭,
引发全球热议和恐慌。
为什么这次AI浪潮如此凶猛?
AI真的全面逼近了人类能力吗?
怎样先人一步,拥抱AI大时代?
6门AI主题课程重磅上线,
20+场大咖公开直播等你来!
AI课程上线日历
– 4月06日
《万维钢·AI前沿课》
万维钢·科学作家
– 4月10日
《快刀青衣·给职场人的 AI 写作课》
快刀青衣·得到联合创始人
– 4月19日
《卓克·怎样用AI高效学习》
卓克·科技观察家
– 4月20日
《刘飞·怎样用AI绘画》
刘飞·资深产品人
– 4月25日
《马馺·怎样用AI做PPT》
马馺·商业演讲策划人
– 4月26日
《吴军·GPT前沿》
吴军·计算机科学家
【备注】:课程上线日期以实际上线日期为主
20+场大咖公开直播
得到用户重磅福利来啦!
系列公开直播,请来20+位大咖嘉宾,
为你解读AI时代的挑战和机遇。
行业大咖:周鸿祎、王小川、王建硕、诸葛越等
专家学者:吴军、郭毅可、何帆、何刚等
得到联合创始人:罗振宇、脱不花、快刀青衣
更多重磅嘉宾正在邀请中,敬请期待……
– 4月03日
【直播主题】从野蛮社会到人工智能
【主讲嘉宾】吴军·计算机科学家
– 4月08日
【直播主题】ChatGPT里,隐藏着哪些企业的新机会?
【主讲嘉宾】王建硕·百姓AI创始人、CEO
– 4月10日
【直播主题】AI时代的得到新战略
【主讲嘉宾】
罗振宇·得到App创始人
脱不花·得到App CEO
快刀青衣·得到App联合创始人
– 4月11日
【直播主题】AI浪潮下的投资机遇
【主讲嘉宾】何刚·《财经》主编
– 4月12日
18:00~19:00
【直播主题】AI浪潮下,经济大局如何变?
【主讲嘉宾】何帆·著名经济学家
20:00~21:00
【直播主题】人工智能引领新工业革命
【主讲嘉宾】周鸿祎·360集团创始人
– 4月15日
【直播主题】ChatGPT 未来技术发展?
【主讲嘉宾】郭毅可·香港科技大学副校长
– 4月16日
【直播主题】王小川聊人工智能创业
【主讲嘉宾】王小川·搜狗创始人
– 4月20日
【直播主题】人工智能的产业政策
【主讲嘉宾】邓志东·清华大学人工智能研究院视觉智能研究中心主任
– 4月25日
【直播主题】AI时代的职场探讨:危机与未来教育
【主讲嘉宾】诸葛越·夸克星辰科技创始人兼CEO
– 4月27日
【直播主题】AI的情绪、道德和文化
【主讲嘉宾】赵昱鲲·清华大学社科学院积极心理学研究中心副主任
备注
1. 直播日程以最终直播时间为准;
2. 更多重磅嘉宾正在邀请中,敬请期待……
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!