NetApp.com
1

什么是深度学习?

人类从经验中学习知识。经验越丰富,可以学到的知识越多。在人工智能 (AI) 学科的深度学习领域,这一原理也相通,即由人工智能软硬件提供动力支持的机器从经验中学习知识。用于机器从中学习知识的这些经验由机器采集的数据确定,数据的数量和质量决定了机器可以学到的知识量。

深度学习是机器学习的一个分支。许多传统机器学习算法学习能力有限,数据量的增加并不能持续增加学到的知识总量,而深度学习系统可以通过访问更多数据来提升性能,即“更多经验”的机器代名词。机器通过深度学习获得足够经验后,即可用于特定的任务,如驾驶汽车、识别田地作物间的杂草、确诊疾病、检测机器故障等。

深度学习的工作原理是什么?

深度学习网络通过发现经验数据中错综复杂的结构进行学习。通过构建包含多个处理层的计算模型,深度学习网络可以创建多个级别的抽象层来表示数据。

例如,卷积神经网络深度学习模型可以使用大量(如几百万个)图像进行训练,比如这些猫的图像。这种类型的神经网络通常从所采集图像中包含的像素进行学习。它可以对图像中猫的身体特征分组(如爪子、耳朵和眼睛),并将表示这些身体特征的像素分类成组。

深度学习与传统机器学习存在根本上的差异。在此示例中,领域专家需要花费相当长的时间对传统机器学习系统进行工程设计,才能检测到形成一只猫的身体特征。而对于深度学习,只需要向系统提供非常大量的猫图像,系统便可以自主学习形成猫的身体特征。

对于许多任务(例如,计算机视觉、语音识别、机器翻译和机器人)来说,深度学习系统的性能远胜于传统机器学习系统。这并不是说,构建深度学习系统与构建传统机器学习系统相比要轻松很多。虽然特征识别在深度学习中自主执行,但我们仍需要调整上千个超参数(按钮),才能确保深度学习模型的有效性。

深度学习的重要性何在?

我们生活在一个充满前所未有机遇的时代,深度学习技术可以帮助我们实现新的突破。深度学习在探索系外行星、开发新型药物、确诊疾病以及检测亚原子粒子等领域,均起到了举足轻重的作用。它可以从根本上增强我们对生物学(包括基因组学、蛋白质组学、代谢组学、免疫组学等)的理解。

我们生活的这个时代也面临着严峻的挑战。气候变化威胁到粮食生产,甚至可能有一天会因为资源有限而爆发战争。环境变化的挑战还将由于人口的不断增长而进一步恶化,到 2050 年全球人口预计将达 90 亿。这些挑战的覆盖面之广、规模之大,必然要求通过深度学习将智能水平推向一个新的高度水平。

在大约 5.4 亿年前的寒武纪生命大爆发期间,视觉成为动物的竞争优势,并很快成为生物进化的主要推动力之一。加上生物神经网络处理视觉信息的能力不断进化,视觉为动物提供了一幅周围环境的地图,提高了动物对外部世界的感知能力。

如今,作为人工眼的相机与可处理这些人工眼捕捉到的视觉信息的神经网络相结合,引爆了由数据驱动的人工智能应用大爆发。就像视觉在地球生命进化中所扮演的关键角色一样,深度学习和神经网络将增强机器人的能力。机器人理解周围环境的能力将越来越强,而且能够做出自主决策,与人类协作,并增强人类自身的能力。

深度学习用例

机器人

机器人的许多最新发展都得益于人工智能和深度学习的发展进步。例如,人工智能使机器人能够感知并响应其周围环境。从原来在仓库各层沿导航路线活动,到现在的分拣和搬运大小不一、易碎或混杂在一起的物体,这一能力扩大了机器人可执行功能的范围。像捡起草莓这么简单的事情对于人类来说是小事一桩,但对机器人而言一直是一项相当困难的任务。随着人工智能的进步,机器人的能力也在不断增强。

人工智能的发展意味着我们可以期待未来机器人越来越多地承担人类助手的工作。未来机器人将不仅仅像目前的有些机器人一样,只是理解和回答问题,而是能够对语音命令和手势做出回应,甚至能够预料工作人员的下一个动作。如今,协作式机器人已经与人类肩并肩工作,各自执行最能发挥其优势的独立任务。

农业

人工智能具有革新农业的潜力。现今,深度学习使农民能够装配可以识别和区分农作物与杂草的设备。这一能力使除草机能够避开农作物,选择性地在杂草上喷洒除草剂。使用计算机视觉(由深度学习提供支持)的农用机器,甚至能够通过选择性地喷洒除草剂、化肥、杀真菌剂、杀虫剂和生物制剂,优化单株。除了减少除草剂的用量和提高农场产量,深度学习的应用范围还可以进一步扩展到其他农场运营活动,例如施肥、灌溉和收割。

医疗成像和医疗保健

由于可使用高质量的数据以及能够通过卷积神经网络对图像分类,深度学习在医疗成像领域成效显著。例如,深度学习在皮肤癌分类上堪比皮肤科医生,甚至更胜一筹。有几家供应商在将深度学习算法用于诊断用途方面已经获得了 FDA 的许可,包络肿瘤学和视网膜疾病的图像分析用途。通过从电子病历数据预测医疗事件,深度学习在提高医疗保健质量方面帮助取得了重大进展。

深度学习的未来

现今已经有了各种针对特定类型的输入和任务进行优化的神经网络架构。卷积神经网络非常擅长图像分类。另一个形式的深度学习架构使用复发性神经网络来处理顺序数据。卷积神经网络模型和复发性神经网络模型都执行我们所说的监督学习,这意味着需要为这些模型提供大量数据以供学习。将来,更精密类型的人工智能将采用无监督学习。无监督和半监督学习技术正在获得大量的研发投入。

与深度学习相比,强化学习是一种略微不同的范式,在这种范式中,智能体在模拟环境中仅仅从奖惩中进行试错式学习。深度学习扩展到这一领域后,称为深度强化学习 (Deep Reinforcement Learning, DRL)。这一领域已经取得相当大的进展,例如,深度强化学习程序在一场围棋游戏中击败了人类。

通过设计神经网络架构来解决问题的难度让人难以想象,再加上许多需要调整的超参数和许多需要选择以进行优化的损失函数,设计复杂性进一步提高。如何自主地学习良好的神经网络架构,目前这方面已经有相当多的研究活动。学会如何学习,也称作元学习或 AutoML,正在取得稳步进展。

当前的人工神经网络是基于二十世纪五十年代对人类大脑如何处理信息的理解。从那时以来,神经科学已经取得显著进步,深度学习架构变得非常精密,以至似乎展现出诸如网格细胞的结构,这种网格细胞在生物神经大脑中用于导航。神经科学和深度学习可以从相互交流中彼此受益,并且两个领域极有可能在未来某个时点合二为一。

我们不再使用机械计算机,在未来某个时点,我们也不会再使用数字计算机,而是使用新一代的量子计算机。最近几年,量子计算已经取得多项突破,能够提供不可思议的超大计算量,学习算法一定可以从中受益。而且,使用学习算法来理解概率量子计算机的输出也很有可能成为现实。量子机器学习是机器学习中非常活跃的一个分支。随着首届国际量子机器学习大会计划于 2018 年召开,量子机器学习即将迎来一个良好的开端。