![](https://csdnimg.cn/release/download_crawler_static/86292307/bg1.jpg)
第 44 卷 第 5 期 自 动 化 学 报 Vol. 44, No. 5
2018 年 5 月 ACTA AUTOMATICA SINICA May, 2018
人工智能研究的新前线: 生成式对抗网络
林懿伦
1, 2, 3
戴星原
1, 2, 3
李 力
4
王 晓
1, 3
王飞跃
1, 5, 6
摘 要 生成式对抗网络 (Generative adversarial networks, GAN) 是当前人工智能学界最为重要的研究热点之一. 其突出的
生成能力不仅可用于生成各类图像和自然语言数据, 还启发和推动了各类半监督学习和无监督学习任务的发展. 本文概括了
GAN 的基本思想, 并对近年来相关的理论与应用研究进行了梳理, 总结了 GAN 常见的网络结构与训练方法, 博弈形式, 集成
方法, 并对一些应用场景进行了介绍. 在此基础上, 本文对 GAN 发展的内在逻辑进行了归纳总结.
关键词 深度学习, 生成式对抗网络, 生成模型, 对抗学习, 平行学习
引用格式 林懿伦, 戴星原, 李力, 王晓, 王飞跃. 人工智能研究的新前线: 生成式对抗网络. 自动化学报, 2018, 44(5):
775−792
DOI 10.16383/j.aas.2018.y000002
The New Frontier of AI Research: Generative Adversarial Networks
LIN Yi-Lun
1, 2, 3
DAI Xing-Yuan
1, 2, 3
LI Li
4
WANG Xiao
1, 3
WANG Fei-Yue
1, 5, 6
Abstract Recently, generative adversarial networks (GAN) have become one of the most popular topics in artificial
intelligent field. Its outstanding capability of generating realistic samples not only revived the research of generative
mo del, but also inspired the research of semi-supervised learning and unsupervised learning. In this paper, we introduce
the basic idea of GAN, and comb its recent development in theory and practice. By concluding its improvements of
network structures, optimization methods, the form of the game, the ensemble methods, and its applications, we found
the inner logic of its development.
Key words Deep learning, generative adversarial networks, generative model, adversarial learning, parallel learning
Citation Lin Yi-Lun, Dai Xing-Yuan, Li Li, Wang Xiao, Wang Fei-Yue. The new frontier of AI research: generative
adversarial networks. Acta Automatica Sinica, 2018, 44(5): 775−792
近年来, 人工智能领域, 特别是机器学习方面的
研究取得了长足的进步. 得益于计算能力的提高, 信
息化工具的普及以及数据量的积累, 人工智能研究
收稿日期 2018-03-01 录用日期 2018-05-01
Manuscript received March 1, 2018; accepted May 1, 2018
国 家 自 然 科 学 基 金 (61533019, 61702519), 北 京 市 科 技 项 目
(D17110600030000, ZC179074Z) 资助
Supported by National Natural Science Foundation of China
(61533019, 61702519), Beijing Municipal Science and Technol-
ogy Commission Program (D17110600030000, ZC179074Z)
本文责任编委 刘德荣
Recommended by Associate Editor LIU De-Rong
1. 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 北京
100190 2. 中国科学院大学 北京 100049 3. 青岛智能产业技术研
究院 青岛 266109 4. 北京信息科学与技术国家研究中心, 清华大学自
动化系 北京 100084 5. 国防科学技术大学军事计算实验与平行系统
技术中心 长沙 410073 6. 中国科学院大学中国经济与社会安全研究
中心 北京 101408
1. The State Key Laboratory for Management and Control of
Complex Systems, Institute of Automation, Chinese Academy
of Sciences, Beijing 100190 2. University of Chinese Academy
of Sciences, Beijing 100049 3. Qingdao Academy of Intelli-
gent Industries, Qingdao 266109 4. Department of Automa-
tion, Beijing National Research Center for Information Science
and Technology (BNRist), Tsinghua University, Beijing 100084
5. Research Center of Military Computational Experiments
and Parallel System, National University of Defense Technology,
Changsha 410073 6. Center of China Economic and Social Se-
curity, The University of Chinese Academy of Sciences, Beijing
101408
的迫切性和可行性都大为提高. 以 Google 等为代
表的 IT 企业, 利用其掌握的海量数据资源, 结合新
的硬件结构和人工智能算法, 实现了一系列新突破
和新应用, 并获得了可观的收益. 这些企业获得的成
功进一步带动了机器学习的研究热度, 使得人工智
能的研究进入了一个新的高潮时期.
在此次的人工智能浪潮中, 以统计机器学习, 深
度学习为代表的机器学习方法是主要的研究方向之
一. 相比符号主义的研究方法, 基于机器学习的人工
智能系统降低了对人类知识的依赖, 转而使用统计
的方法从数据中直接习得知识. 机器学习理论是一
次重要的范式革命, 使人工智能领域的研究重点从
算法设计转向了特征工程与优化方法.
一般而言, 依据数据集是否有标记, 机器学习任
务可被分为有监督学习 (又称预测性学习, 数据集
有标记) 与无监督学习 (又称描述性学习, 数据集无
标记)
[1]
. 随着数据收集手段, 算力与算法的不断发
展, 在诸多监督学习任务中, 如图像识别
[2−3]
, 语音
识别
[4−5]
, 机器翻译
[6−7]
等, 机器学习方法, 特别是
深度学习方法都取得了目前最好的成绩.
然而, 有监督学习需要人为给数据加入标签. 这
带来了两个问题: 一是数据集采集后需要大量人力
评论0