智能制造:AI落地制造业之道
上QQ阅读APP看书,第一时间看更新

1.3 人工智能技术是实现智能制造的原动力

企业数字化实现了生产设备、设施的数字化,它还通过一系列工业软件实现了产品研发设计、经营管理的数字化。同时应用大数据管理平台、企业知识图谱、专家系统可以对企业知识和数据进行管理。如果能够充分利用人工智能技术开发公司开发的一系列人工智能通用工具、软件、产品、人工智能开源开放平台,实现人工智能技术在制造业企业的落地就会容易得多。人工智能技术如机器视觉、语音识别、自然语言处理、机器学习、深度学习、增强学习、迁移学习、人工智能操作系统等都能在智能制造中发挥重大作用。

1.3.1 机器视觉

机器视觉是指利用计算机对图像进行处理、分析和理解,以识别各种目标的技术,也就是用机器代替人眼来做测量和判断,是应用深度学习算法的一种实践。机器视觉分为图像采集、图像预处理、特征提取和图像识别四个步骤。现阶段机器视觉技术一般用于质量检测、自动驾驶、医疗诊断、无人值守车库闸机、人脸识别与商品识别等。质量检测用于产品外观形状和尺寸检测、零件尺寸检测、表面或内部缺陷检测;自动驾驶用于车道线保持、信号灯识别、行人识别、停车辅助等;医疗诊断用于医学影像的分析和诊断;具备机器视觉能力的无人值守车库闸机,能将车牌的图像变成文字并用语音读出,从而进行车辆的识别和收费管理;人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。

就机器视觉软件代表来说,国外有康耐视等,国内则有图智能、海深科技等。

1.3.2 语音识别和自然语言处理

语音识别也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的词汇内容转换为计算机可读取的输入,例如按键、二进制编码或者字符序列。语音合成是语音识别的逆过程,也称为文字转语音,它是一种将计算机自己产生的或外部输入的文字信息转变为易懂且流畅的口语输出。有了语音识别和语音合成,就能实现自然语言处理。如果想要让机器在与人交流时做到对答如流,还需要赋予机器灵魂,其中自然语言处理(NLP)就是关键。

自然语言处理是计算机领域与人工智能领域中的一个重要分支。由于数据大幅度增长、计算力大幅度提升,深度学习也实现了端到端的训练,人工智能的发展进入了一个高潮。人们也逐渐开始将深度学习方法引入NLP领域,在机器翻译、问答系统、自动摘要等方面取得成功。百度音箱就是自然语言处理与百度搜索结合的产物,科大讯飞的语言识别和翻译机已经有了很成熟的商品。

1.3.3 机器学习、深度学习、增强学习和迁移学习

1. 机器学习

机器学习的创始人之一亚瑟·塞缪尔(Arthur Samuel)在1959年将机器学习描述为一个让计算机无须显式编程也能进行学习的研究领域。1998年,另一位著名的机器学习研究者汤姆·M. 米契尔(Tom M. Mitchell)提出了一个更精确的定义,假设用性能度量P来评估计算机程序在某类任务的性能,若一个程序通过利用经验E在任务T中改善了性能,那么可以称这个程序从经验E中学习。为了阐述清楚,在此举一个例子:在下棋程序中,经验E指的就是程序上万次的自我实战经验,任务T就是下棋,性能度量P指的就是在比赛过程中取胜的概率,有了性能指标后,就能告诉系统是否要学习该经验。机器学习能够让程序从训练数据中学习,以便对新的、未知的数据做出尽可能准确的预测。

2. 深度学习

深度学习自1943年神经网络和数学模型MCP模型提出后,经过73年的研究和发展,直到2016年谷歌旗下的DeepMind公司基于深度学习开发的AlphaGo以4比1的比分战胜了国际顶尖围棋高手李世石才被推到世人面前。后来,AlphaGo又接连和众多世界级围棋高手过招,均取得完胜。2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认AlphaGo的棋力已经超过人类顶尖职业围棋选手。同年,基于强化学习算法的AlphaGo升级版AlphaGo Zero横空出世,其采用“从零开始”“无师自通”的学习模式,以100:0的比分轻而易举打败了之前的AlphaGo。除了围棋,它还精通国际象棋等其他棋类游戏,可以说是真正的棋类“天才”。

深度学习是机器学习中一种基于使用深度神经网络为工具的机器学习算法,使用含多隐层的多层感知器的深度学习结构,通过组合底层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征。深度学习使用无监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。McCulloch-Pitts Neuron简称为MCP模型。所谓MCP模型,其实是按照生物神经元的结构和工作原理构造出来的一个抽象和简化了的模型,当时是希望MCP能够用计算机来模拟人的神经元反应的过程,该模型将神经元简化为三个过程:输入信号线性加权,求和,非线性激活(阈值法),其算法如图1.8所示。

0

图1.8 深度学习的MCP算法

图1.8中,xi指第i个神经元的输入,wi指第i个神经元的连接权重,θ指阀值

0

深度学习的模型有很多,目前开发者最常用的深度学习模型与架构包括卷积神经网络(CNN)、深度置信网络(DBN)、受限玻耳兹曼机(RBM)、递归神经网络(RNN、LSTM、GRU)、递归张量神经网络(RNTN)、自动编码器(AutoEncoder)、生成对抗网络(GAN),等等。

3. 增强学习

增强学习是机器学习中的一个领域,强调如何基于环境行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大收益的习惯性行为。因此,增强学习实际上是指智能体在与环境进行交互的过程中,学会了最佳决策序列。增强学习由以下要素组成:

智能体(agent):增强学习的本体,作为学习者或者决策者。

环境(environment):增强学习智能体以外的一切,主要由状态集合组成。

状态(state):一个表示环境的数据,状态集则是环境中所有可能的状态。

动作(action):智能体可以做出的动作,动作集则是智能体可以做出的所有动作。

奖励(reward):智能体在执行一个动作后,获得的正/负反馈信号,奖励集则是智能体可以获得的所有反馈信息。

策略(policy):增强学习是从环境状态到动作的映射学习,一般将该映射关系称为策略。通俗来说,即智能体如何选择动作的思考过程就是策略。

目标(objective):智能体自动寻找在连续时间序列里的最优策略,而最优策略通常指最大化长期累积奖励。在此基础上,智能体和环境通过状态、动作、奖励进行交互,智能体执行了某个动作后,环境将会转换到一个新的状态,而对于新的状态,环境会给出奖励信号(正奖励或者负奖励)。随后,智能体根据新的状态和环境反馈的奖励,按照一定的策略执行新的动作。

4. 迁移学习

迁移学习顾名思义就是把已训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的,所以通过迁移学习可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型,从而加快并优化模型的学习效率,而不用像大多数网络那样从零学习(Starting From Scratch)。在迁移学习中,首先在基础数据集和任务上训练一个基础网络,然后将学习到的特征重新调整或者迁移到另一个目标网络上,以此来训练目标任务的数据集。如果这些特征是容易泛化的,且同时适用于基本任务和目标任务,而不只是特定于基本任务,那迁移学习就能有效进行。

以上讨论的算法和人工智能的关系如图1.9所示,可以看出,提及的算法都是属于人工智能的范畴,它们相互交叉但不完全重合,机器学习是人工智能的算法基石,而其他算法都是机器学习的一个分支。

0

图1.9 机器学习等和人工智能之间的关系

1.3.4 人工智能操作系统

计算机有操作系统,从DOS到Windows、Unix、Linux等,手机有安卓以及iOS,工程师们在这些操作系统环境下开发各种各样的应用系统。那么,如果有了人工智能操作系统,就可以为制造业融入人工智能提供强有力的工具。人工智能操作系统应具有通用操作系统所具备的功能,并且包括语音识别、机器视觉、执行系统和认知行为系统(具体包含文件系统、进程管理、进程间通信、内存管理、网络通信、安全机制、驱动程序、用户界面、语音识别子系统、机器视觉子系统、执行子系统、认知子系统等)。图1.10是百度飞桨(PaddlePaddle)人工智能操作系统全景图,也叫飞桨深度学习平台。

0

图1.10 百度飞桨人工智能操作系统全景图

百度飞桨是国际领先的端到端开源深度学习平台,集核心框架、工具组和服务平台为一体,拥有兼顾灵活性和高性能的开发机制、工业级的模型库、超大规模分布式训练技术、高速推理引擎以及系统化的社区服务五大优势。飞桨深度学习平台起到了承上启下的作用,上承各种业务模型、行业应用,下接芯片、大型计算机系统,致力于让深度学习技术的创新与应用更简单。

核心框架:飞桨为用户提供丰富的软件开发、训练和预测的工具,还提供动态图和静态图两种计算图。动态图组网更灵活、调试网络更便捷,实现AI更快速;静态图部署方便、运行速度快,应用落地更高效。飞桨提供的80多种官方模型,全部经过真实应用场景的有效验证,其中不仅包含“更懂中文”的NLP模型,还包括同时开源多个视觉领域国际竞赛冠军算法。飞桨同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练。支持万亿规模参数、数百个节点的高效并行训练,提供强大的深度学习并行技术。飞桨提供高性价比的多机CPU参数服务器解决方案,基于真实的推荐场景的数据验证,可有效地解决超大规模推荐系统、超大规模数据、自膨胀的海量特征及高频率模型迭代的问题,实现高吞吐量和高加速比。飞桨完整支持多框架、多硬件和多操作系统,为用户提供高兼容性、高性能的多端部署能力。依托业界领先的底层加速库,利用Paddle Lite和Paddle Serving分别实现为端侧和服务器上的部署飞桨提供高效的自动化模型压缩库 PaddleSlim,实现高精度的模型体积优化,并提供业界领先的轻量级模型结构自动搜索Light-NAS。

工具组:飞桨提供很多工具。飞桨PaddleHub是预训练模型管理和迁移学习组件,10行代码就可以完成迁移学习,它提供40多种预训练模型,覆盖文本、图像、视频三大领域八类模型。模型即软件,通过Python API或者命令行工具,一行代码就可以完成预训练模型的预测,结合Fine-tune API,10行代码就可以完成迁移学习。飞桨PARL是一种基于飞桨的深度强化学习框架,具有高灵活性和可扩展性,支持可定制的并行扩展,覆盖DQN、DDPG、PPO、IMPALA、A2C、GA3C等主流强化学习算法。飞桨AutoDL Design能够让深度学习来设计深度学习,设计的部分网络效果可优于人类专家的设计效果。AutoDL Design包含网络结构自动化设计、迁移小数据建模和适配边缘计算三个部分。开源的AutoDL Design自动网络结构设计的图像分类网络在CIFAR10数据集中正确率达到98%,效果优于目前已公开的10种人类专家设计的网络,居于业内领先位置。飞桨VisualDL可以看作为一个深度学习可视化的工具库,能够可视化深度学习过程,帮助开发者方便地观测训练整体趋势、数据样本质量、数据中间结果、参数分布和变化趋势、模型的结构,更便捷地处理深度学习任务。飞桨EDL能够实现弹性深度学习计算,资源空闲时一个训练作业多用一些资源,忙碌的时候少用一些资源,实现资源弹性调度。飞桨PGL是支持百亿规模巨图的工业级图学习框架。它支持分布式图存储及分布式学习算法,覆盖30余种图学习模型,包括图语义理解模型ERNIESage等。

服务平台:飞桨为用户提供了很好的服务工具。飞桨EasyDL为零算法基础的企业用户和开发者提供高精度的AI模型定制服务,已在零售、工业、安防、医疗、互联网、物流等20多个行业中落地应用。飞桨AI Studio是一站式深度学习开发平台,集开放数据、开源算法、算力三位一体,为开发者提供高效学习和开发环境、竞赛项目,支撑高校老师轻松实现AI教学,并助力企业加速落地AI业务场景。飞桨EasyEdge是端计算模型生成平台,可基于多种深度学习框架、网络结构的模型,快捷生成端计算模型及封装SDK,适配多种AI芯片与操作系统。

类似的人工智能操作系统还有很多,如TensorFlow、Keras、MXNet、PyTorch、CNTK、Theano、Caffe、DeepLearning4、Neon 等。谷歌、微软、亚马逊、Facebook等商业巨头都加入了这场深度学习框架大战,国内除百度外还有旷视科技也在研发使用自主开发的深度学习框架。

在当下新工业革命和人工智能发展的大背景下,深度学习的通用性特点,加上深度学习框架及平台的发展,正在推动人工智能标准化、自动化和模块化,人工智能的应用进入工业大生产阶段。作为制造业企业,要善于运用这些研究成果和平台工具,快速、高水平、低成本地实现人工智能在制造业的落地。

应用场景是AI在智能制造中落地,企业数字化是实现智能制造的基础,人工智能技术是实现智能制造的原动力,有了基础和原动力,本书将分别就人工智能技术在机电产品、研发设计、经营管理、生产制造、客户服务、经营决策六个方面的融合之道(即应用场景)展开介绍。