自动驾驶、与人对话、翻译,甚至辅助治病、绘画、拍电影,人工智能的高速发展,让一些曾经只在电影中出现、令人匪夷所思的场景,现在已经在日常生活中随处可见。在未来,我们还能见证人工智能做更多我们现在还无法想象的事情。生活在今天的每一个人,都应该了解一点人工智能,才能跟上这个时代的步伐。
机器是怎么学习的?
它如何理解人类语言?
大模型是什么?
AI如何改变世界?
继《计算机教授给孩子讲历史》后,复旦大学计算机学院的钱振兴教授这次为我们带来一本大众都能看的人工智能普及读物《计算机教授白话人工智能》~
钱教授相信,如果一个人从小就“见过”很多创新,那他未来一定很有创造力。比起碎片化阅读,我们更需要掌握建立整体制作室框架的能力,这是探索与创新的基础。
《计算机教授白话人工智能》这本书
适合所有年龄段阅读
当然,尤其适合中小学生~
快速了解人工智能的来龙去脉
形成对人工智能的整体认识
激发对人工智能的兴趣
就看它!
01
什么是人工智能
最近几年,人工智能(Artificial Intelligence,简称AI)火遍全世界。那么,什么是人工智能?这个问题我们需要探讨一下。
“人工”,顾名思义,是人创造出来的。那“智能”又是什么?从字面上看,“智能”应该包含了“智力”和“能力”两重含义,智力是认识世界的本领,能力则是开展各种活动的本领。因此我们可以简单地说,“人工智能”是人类创造的智能体(机器或程序),用于模拟人类的智能。
现在,几乎大家能想到的各种应用场景,都已发展出了相应的人工智能技术。比如知识问答、写文章、绘画、拍电影、创作音乐、翻译、编程、自动驾驶、医疗辅助、安防监控、智慧农业等。这样的人造智能体很多,人工智能的概念远比大家想象的宽泛。
名震天下的大语言模型ChatGPT(Chat Generative Pre-trained Transformer)是人工智能吗?是的。你可以和ChatGPT对话,让它写出一段条理清晰的文字,或者一首隽永的诗歌,甚至可以让它作出一篇高考满分作文。
智能手表是人工智能吗?是的,它可以监测用户的心率、血氧、运动轨迹、睡眠质量等数据,自动分析人体的健康状况,随时为人们提供服务,部分具备了医生的能力。甚至一个简单的智能红外线报警器,也可以算是一种人工智能,它可以精准地感应到人的存在。
世界上还有很多并非人类制造的智能体。比如,蜜蜂能够采集花粉和酿造蜂蜜,植物能够根据阳光调整叶子的方向,蚂蚁能够有组织地进行食物采集,猎犬可以帮助猎人追踪、搜寻猎物,等等。这些“智能”不是靠“人工”实现的,是通过神经系统和生物结构来实现的,因而被称为“生物智能”。
人工智能和生物智能有显著的区别。生物智能是基于自身的神经系统实现的智能,根据周围的环境变化进行认知和动作,需要大量的生物能量。人工智能则是使用计算机系统实现的智能,依赖硬件和软件,从数据学习中找出解决问题的方法,这个过程需要电力提供能量。由于生物智能依赖于碳水化合物,因而它又被称为“碳基”智能;而人工智能依赖于计算机芯片(主要成分是硅),因而它又被称为“硅基”智能。
目前,人工智能已经对我们人类社会的多种活动产生了重要影响。人工智能可以自动完成许多烦琐的任务,解放了人的脑力和体力。比如,智能机器人、智能家居等应用,可以提高人们的生活质量;智能交通、智能城市等应用,可以让城市管理变得更加高效,可以更有效地改善城市环境;人工智能强大的计算能力和数据处理能力,在医疗诊断、金融风险评估等领域也发挥着重要作用。在图像内容识别、自然语言处理等领域中,很多人工智能已经展示出超越人类的能力。
然而,现有的人工智能技术还不具备通用性,无法在所有领域都实现人的智能。在逻辑推理、数学计算等方面,人工智能容易受到各方面的干扰,无法完美地处理异常或错误。
与GPT-3.5对话,显示人工智能在逻辑推理方面存在不足(资料来源:OpenAI官网)
这个例子中,一个错误的问题成功地诱导人工智能大模型给出了错误答复。我们向ChatGPT提问“哥哥的哥哥为什么叫大伯”,于是大模型先入为主地认为“哥哥的哥哥就是大伯”,并对此进行一系列错误的解释说明。这种问题在现代大模型中时常会发生,科学家们正在研究如何避免类似的错误(GPT-4.0对该问题已经给出了正确的解答)。当前,追求通用人工智能(Artificial General Intelligence,简称AGI)是许多研究者的梦想,即让机器具备人的所有智慧能力。
人工智能的发展还带来了一系列挑战和问题。例如,人工智能系统在学习过程中需要使用大量数据,这可能侵犯用户隐私或用户权益;人工智能技术也有可能被用于网络攻击、黑客行为等非法活动;人工智能算法的决策过程,可能还存在严重的错误或偏见。如何避免人工智能带来的负面影响,是全世界重点关注的问题。
总的看来,人工智能的意义在于,它可以解放人类的脑力和体力,推动社会的进步。当然,我们也要关注并解决它在发展过程中出现的问题,让它更好地为人类服务。
02
是人,还是机器
英国人艾伦 · 图灵出生于1912年,在多个科学领域有杰出贡献,是计算机科学家、数学家、逻辑学家、密码分析学家、理论生物学家,被誉为“计算机科学之父”“人工智能之父”“密码破译之父”。
图灵提出的图灵机模型建立了现代计算机的工作逻辑,通过简单的操作就可以执行复杂的计算任务,为现代计算机的发明奠定了理论基础。图灵在人工智能方面也做出了历史性的开创工作。
1950年,图灵首次提出要让计算机像人一样思考。在论文《计算机器与智能》(Computing Machinery and Intelligence)中,他提出一个影响深远的问题:“机器会思考吗?”图灵并不是在询问机器是否具备生物学意义上的思考能力,而是探究机器是否能够模拟人类思考的过程——让人们无法区分输出来自人类还是机器!
如果机器的行为在某种程度上足够接近人类,以至于我们无法区分,那么我们就可以认为机器在特定意义上“会思考”!这种思考方式,为人们提供了一种评估机器智能水平的框架。
由于上述这个标准并不像数学定义那样严格,充满了主观色彩,很难准确地界定。为此,图灵提出一种评估机器是否具备人类智能的测试方法——图灵测试。
图灵测试示意图
在测试过程中,测试者与被测试者(一个人和一台计算机)被分隔开,测试者并不清楚被测试的人类和计算机分别在哪个房间。测试者通过一些输入设备(如键盘)向被测试者随意提问。测试者根据被测试者的回答,判断被测试者是机器还是人。经过多次测试后,如果计算机能够让所有测试者误判的平均次数超过总次数的30%,即认为这台计算机通过了测试,并认为该机器具有人类智能。这就是图灵测试的基本思想。
图灵测试极大地推动了人工智能的发展,它为人们提供了一种理解和评估机器智能的方法,激励后来的研究者不断追求更高级别的机器智能。图灵曾经预测,到2000年人类应该能够使用10 GB的计算机设备,制造出可在5分钟问答中骗过30%成年人的人工智能。然而,从目前的科技发展来看,我们远远落后于这个预测。
图灵测试也存在一些争议和局限性。图灵测试依赖于人的判断,虽然通过增加测试人数可以减少人类主观因素带来的影响,但图灵测试没有规定问题的范围和提问的标准,使得测试结果具有一定的模糊性和不确定性。
“智能”是一个复杂的概念,包括逻辑推理、创造力、情感理解等多个方面,图灵测试更关注语言理解和交流能力,忽略了其他方面的因素,因而即使一个机器通过了图灵测试,也不足以证明它具备了全面的智能。图灵测试还存在“中文屋悖论”(一个不懂中文的人在一个房间里,使用一本中文对照书将中文输入转化为输出,尽管从外界看来他似乎理解中文,实际上并不理解)等问题。美国著名哲学家约翰 · 塞尔(John Searle)指出,一台机器能够按照预设的规则回答问题,并不表明它理解了问题的含义或掌握了真正的智能。
人工智能系统的多样性正在不断增加,一些智能系统可能只擅长处理特定领域的任务,在其他领域则表现不佳,图灵测试很难准确评估这些系统的智能水平。
图灵测试和他的论文《计算机器与智能》是人工智能研究的基础,开启了人工智能领域的新篇章,为后来者提供了重要的启示,激发了更多的思考。随着人工智能技术的不断发展,人们对机器智能的理解也在不断深化,不再局限于图灵测试的简单框架,而出现了许多更复杂的测试方法。但无论如何,图灵提出的这个问题都将继续引导人们思考机器智能的本质和未来。
让机器和人一样思考,在那个年代无疑是个石破天惊的疯狂想法。回顾历史,很多重大的发现和发明,都来自这些疯狂的想法,或许正如孔夫子说的那样——“狂者进取”罢!
作为“人工智能之父”,图灵的理论贡献和实践研究,推动了人工智能领域的发展,为我们理解智能和认知的本质提供了新的视角,他的思想和成就永远铭刻在人工智能的历史长河中。
1966年,美国计算机协会(Association for Computing Machinery,简称ACM)设立了图灵奖,用以奖励那些对计算机事业作出重要贡献的个人,它是美国计算机协会在计算机技术方面所授予的最高奖项,被誉为“计算机学界的诺贝尔奖”。
03
机器是怎么学习的
机器学习是人工智能的分支,也是当前人工智能的主流。它让计算机从数据中学习规律或方法,从而具备预测或判决的能力。
比如,我们想预测明天的天气情况,可以搜集以往的天气状况,让机器分析一下天气变化的趋势,得出明天最有可能出现的天气。再比如,我们希望机器能够自动识别猫和狗,可以预先准备很多猫和狗的图片,分别给它们贴上猫或狗的标签,让机器去学习两种动物的差别,当完成学习后,机器就可以形成自动识别猫和狗的本领,以后再给它猫和狗的新图片,它就能正确区分猫和狗。
想一想,人类似乎就是这样学习本领的!
机器学习的基本逻辑
在机器学习中,最常见的方法如上图所示,可以分为三个阶段。人们先给机器很多例子(学习资料),让机器逐步调整自己的参数,提高识别的准确性至最优。然后,拿一些新例子去测试(考试),看看机器学得怎么样。只有通过测试的模型,才会被拿出来给人使用。
机器学习的方法分很多种,最常见的是下面三种:监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、强化学习(Reinforcement Learning)。
监督学习,指在机器学习的过程中,不仅提供问题,还提供标准答案,机器通过参考答案来理解问题。当机器完成学习之后,用考题来检查它学习得怎么样。常见的监督学习算法有回归、分类等。
无监督学习,就没有那么好的条件了,在机器学习的过程中,只提供问题,不提供答案,机器需要自己去找答案,尝试找出数据中的一些规律或者把相似的东西归类,常见的无监督学习算法有聚类等。
强化学习,就是让机器通过各种尝试来寻找答案,每次尝试后都会得到反馈分数,机器根据得分来调整下一步的行为,这种方法在智能下棋的游戏中很常见。
大家可能会有一个疑问,如何评价一个机器学习出来的模型好不好呢?判断的方法多种多样,这里介绍三种。
首先,一般我们要在应用中观察机器学习模型输出结果的“准确性”(Accuracy),可以直接将模型输出的结果与真实结果作比较,也可以将模型输出的结果与人类给出的结果作比较,计算模型输出的准确率。
其次,我们要考察模型的“泛化性”(Generalization),观察模型在不同的数据集上输出的准确性。举个例子,机器如果用上海的中学教材来学习,用上海的中学试卷考试可以得高分,那么用江苏的中学试卷来考试能不能考好呢?这考验的就是模型的泛化性,也就是应用的普适性。
再次,对于使用人工智能生成内容的大模型来说,我们还期望模型能够产生“涌现能力”(Emergence),这既可以认为是机器学习能够实现“量变引起质变”,也可以认为是合成意想不到的内容,如同人类大脑的灵感迸发。
机器学习已经改变了世界,在各行各业中都有应用,比如人脸识别、语音助手、商品推荐、智能家居、医疗诊断、智能翻译、智慧交通等。随着科技的不断发展,机器学习将在更多领域发挥作用,帮助人们解决问题,让生活变得更加美好。
《计算机教授白话人工智能》
钱振兴 著
刘西越 责编
复旦大学出版社
内容简介
这是一本面向大众的人工智能普及读物,旨在帮助大家快速了解人工智能的来龙去脉,并形成对这一领域的整体认知。本书完全用白话描述,没有专业知识门槛,适合各年龄段的读者阅读,帮助大家轻松入门。
这本书延续了作者在《计算机教授给孩子讲历史》一书中所倡导的理念与方法,旨在激发读者(尤其是孩子)对知识探索的兴趣。在用通俗易懂的语言介绍相关领域知识的同时,力图帮助大家搭建知识框架,建立知识体系。
在碎片化阅读的时代,我们更需要掌握建立整体知识框架的能力,这是探索与创新的基础。希望这本书能够帮助大家对人工智能产生兴趣,激发大家的思考,最终迈出探索人工智能的第一步。
作者简介
钱振兴,复旦大学计算机科学技术学院教授、博士生导师。担任复旦大学文化与旅游部重点实验室副主任,以及多个国际著名学术期刊编委。获得上海市自然科学奖一等奖、上海市科技进步奖二等奖等奖项,中国图象图形学学会“科普先进工作者”称号。编著《计算机教授给孩子讲历史》《多媒体与人工智能安全极简综述》等图书。
目录
本期编辑 | 李映潼
转载及合作请联系:liyingtong25@163.com