2.2 基于机器学习的当代人工“智能”
1956年,达特茅斯会议宣告了人工智能的诞生。AI技术在长期的发展中,已经有了实质性的变化,尽管它的名字依然叫人工智能。
2.2.1 人工智能3个阶段的比较
人工智能可以划分为3个阶段:过去、当前、未来。这不仅代表时间先后,还代表了含义的本质区别。
1. 过去的“人工智能?”
这个阶段的人工智能基于人类事先制定的规则,以模式识别、专家系统为代表,其在大多数应用领域的实际表现都明显弱于人类,所以在智能一词后面加了问号。过去的人工智能只是计算机科学的一个小分支,而且是长期处于边缘地位的小分支。
2. 当前的人工“智能”
“当前”要从2012年左右算起,具体会持续多久尚不明确。这个阶段的人工智能主要基于机器学习尤其是深度学习,且已在多个单项能力上超越了人类。从实现的结果上看,其似乎具备了一定的智能,但究其实质,当前的人工“智能”还是来自数值计算,与人类智能的内在机理还有本质区别,所以在“智能”一词上加了引号。
当前的人工“智能”仍然是计算机科学领域的一个分支,但已经成了非常热门的分支。
3. 未来的“人工智能!”
未来的“人工智能!”是指未来可能实现的通用人工智能和强人工智能。如果实现了,一定是人类历史上非常重大的事件,将对人类社会乃至人类存在的意义产生根本性影响。这个阶段的人工智能才是真正的智能,“智能”一词后面的感叹号表达了这种震撼。
从学术角度上讲,未来的通用人工智能、强人工智能将成为一门独立的科学,而且将可能成为“凌驾”于其他所有科学之上的超级科学。因为强人工智能具有真正的“智能”,可以研究其他科学。
人工智能三要素——算法、算力和数据,算法是为了给算力助力、指路,数据是为了给算力提供“材料”。2006年,杰弗里·辛顿提出深度学习算法。这是人工智能算法历史性的突破,由此算法成为AI技术的领导性因素。借助这种算法,人工智能在很多领域取得了快速进步,并在多个领域胜过了人类智能,如人工智能在ImageNet图像识别大赛中胜过人类、打败德州扑克的人类高手赢得奖金,这都是基于深度学习算法。
目前,进行规模化应用的人工智能技术大多数采用了深度学习算法。如果一定要为人工智能的第三次热潮确定一个开始年份,我认为是2006年,就是杰弗里·辛顿提出深度学习算法的那一年。
Google、微软、百度等互联网巨头,还有众多的初创科技公司,纷纷加入了人工智能产品的“战场”,掀起了2016年至2018年的AI发展热潮。
我们用一张表来简单对比一下过去、当前、未来的人工智能。
过去、当前、未来的人工智能对比
下文提到的人工智能,除特别说明外,都是指当前的人工“智能”。
2.2.2 人工智能涉及的基本概念及其关系
人工智能涉及很多概念,有些概念在AI科学家和AI工程师的圈子里也没有达成一致。因此,要想理解人工智能,我们需要花一点时间来厘清人工智能的一些重要概念,从而使我们以后在进行讨论时,能用同一种概念对话。
人工智能,是通过人工的方式实现部分原本只有人类才能实现的智能。
机器学习,可以按字面意思来理解,就是机器自己进行学习。有了学习能力就能不断进步,这是机器学习有别于此前基于规则、基于编程的人工智能的重大区别。
我们常说人工智能的3个要素是算法、算力和数据(尤其是大数据)。那么,三者和机器学习是什么关系?机器学习和人工智能又是什么关系?经常被大家提到的模型又是什么?为了便于读者理解,我将这些概念的关系绘制在下面这张图上。
人工智能涉及的概念及其关系
根据这张图可以简要进行如下讲解。
1. 算法、算力和数据
这3个要素协作进行机器学习,从而“培养”出人工智能。如果用人类做类比,那么人工智能的算法是大脑、算力是肌肉、数据则是食物。
2. 机器学习与人工智能
人工智能是从机器学习而来的,机器最初和刚诞生的婴儿一样如同一张白纸,它通过学习逐渐具备智能。在上图中,“机器学习”上面的箭头指向“人工智能”,表明了两者之间的关系。简单地说,就是“机器通过学习产生人工智能”。
3. 模型
模型是智能的载体,和以上几个概念都存在紧密关系。
如果要用AI解决问题,我们就需要设计、构建一个模型。
(1)模型与算法。所谓的构建模型就是用代码把模型创建出来,用代码把算法写出来。
(2)模型与算力。模型训练的本质就是进行大量的计算,这些都需要算力的支持。
(3)模型与数据。刚刚构建完成的模型是没有任何智能的,我们需要用数据对模型进行训练,让模型快速“进化”出智能。
(4)模型与机器学习。从人类的角度看,这是在进行模型训练;从机器的角度看,这就是机器学习。
(5)模型与人工智能。训练完的模型具有了某种“智能”,这时它就可以用来解决问题、发挥价值了。这可以理解为,训练完的模型承载了人工“智能”。
算法、算力和数据这3个要素都很重要,只有三者通力合作才能产生人工智能。如果一定要选出一个最重要的要素,我认为是算法。以AlphaGo的不同版本为例,随着版本的升级,其能力越来越强,但消耗的能量越来越少,其中的关键便是算法的进化。各代AlphaGo的算力和能量消耗对比如下图所示。
各代AlphaGo的算力和能量消耗对比
在上图中,Power Consumption指用电量,TDP指散热设计功耗。其中,横轴是AlphaGo按时间顺序出现的不同版本,Lee是战胜韩国棋手李世石的版本,Zero是战胜我国棋手柯洁的版本。从Lee开始,芯片从GPU(图形处理器)换成了Google的TPU(张量处理器)。在很短的时间内,AlphaGo的能力越来越强,但消耗的算力和电力反而越来越少,这主要得益于算法的进步。如果说算力是蛮力,那么算法则是巧力。
算法的进化是非常难的,可能要十年甚至更长时间才会有重大进展,所以只有极少数科学家能在其中有所建树。相比之下,算力一直在稳步进化,数据一直在持续增加,算力、数据带来的效益更加实惠一些。