AIGC革命:Web 3.0时代的新一轮科技浪潮
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

02 深度学习:推动AIGC的根本动力

深度学习算法是机器学习领域的一个重要研究方向,基本方法是机器对大量训练数据进行学习,掌握样本信息的内涵和规律,获取与人类的思维模式相似的分析学习能力。在AIGC领域,这一能力的应用表现在多语言翻译、文字生成、图像生成、语音合成等方面。与根据算法规则生成内容的智能模型不同,AIGC深度学习模型通过大量的数据训练和特征学习,能够准确、灵活、快速地生成多种模态的数据内容,表现出更高的智能化水平。

(1)机器学习的主流算法及其原理

根据机器学习的应用情况,其学习算法主要可以分为三类:监督学习算法(Supervised Learning)、非监督学习算法(Unsupervised Learning)和强化学习算法(Reinforcement Learning),如图2-1所示。

图2-1 机器学习的主流算法

监督学习算法与非监督学习算法、强化学习算法的对比关系如表2-1所示。

表2-1 不同形态的机器学习算法对比

①监督学习算法

监督学习算法是训练人工神经网络的常用算法,也是机器学习中比较容易理解和实现的算法之一。简单地说,监督学习就是机器通过有标签的训练数据集(包括输入和输出,或特征和目标)学习出一个模型参数,再利用该模型将新的输入数据映射为相应的输出,这实际上是让机器学习由人类创建的模型的过程。

常见的卷积神经网络(convolutional neural networks)也属于监督学习算法的范畴,它在图像分类领域(如人脸识别)有广泛的应用。

②非监督学习算法

非监督学习算法与监督学习算法原理类似,也要求输入和输出结果,但非监督学习算法所学习的数据集没有人为标注,也没有确定的数据类别和输出目标,而是让机器自己学习,根据样本数据的相似性进行分类(Clustering),然后利用聚类结果,提取数据集中的隐藏信息,基于该信息对新数据进行预测。生成对抗网络(GAN)就属于非监督学习算法,常用于图像生成。

③强化学习算法

与监督学习和非监督学习算法中的样本分类任务不同,强化学习算法的任务是指导训练对象如何决策,它在给定的数据环境下,不断与环境交互,基于环境反馈进行下一步行动,以达成目标或使整体收益最大化。强化学习算法实际上是一套决策系统,在游戏设计领域有广泛应用。例如著名的AlphaGo就是基于强化学习算法的专家系统,其训练目标是让棋子尽可能占领棋盘上更多的区域。

从以上几种算法中我们可以看出,不论哪种算法,在进行模型训练时都非常重视对训练数据特征的选取和处理,而训练数据往往是多种多样且复杂的(例如带有文字的海量图片),因此难以直接、有效地提取其特征。此时,机器学习就不再仅仅局限于对句子或图片特征的识别,还需要找到它们背后隐含的逻辑关系,而深度学习为这一问题提供了解决方案,其基本思路是通过多层网络的构建和训练来处理未知数据,使其输出符合人类预期的结果。

(2)深度学习算法:推动AIGC的根本动力

深度学习算法的迭代升级是AIGC相关技术发展的最根本动力。AIGC相关技术的演进大致可分为前深度学习阶段和深度学习阶段,各有其阶段特点:

a.在前深度学习阶段,AIGC相关模型不具备对客观世界的认知能力和生成新内容的创造力,虽然可以根据既定的算法规则或模板输出内容,但在本质上是对已有内容的复制或调用,且容易输出文不对题的内容,能够满足的用户需求非常有限。

b.在深度学习阶段,深度神经网络理论的创新、相关模型架构和学习范式的优化使人工智能的学习能力大大提升,为AIGC技术的进一步发展创造了条件。

随着深度学习理论的提出,卷积神经网络的表征学习能力逐渐受到重视,2012年,卷积神经网络AlexNet成为ImageNet大规模视觉识别竞赛的优胜算法,这一技术突破带来了深度学习的大爆发。2014年,生成对抗网络被提出,为深度学习开辟了新的研究方向,有效提升了生成内容(主要是图片)的精度和真实性。此外,强化学习、扩散模型(Diffusion Model)等学习范式的发展,都为真正实现AIGC创造了条件。