论文研究-DTCNN的人脸识别算法的Map-Reduce并行化实现研究.pdf

所需积分/C币:13 2019-09-20 18:38:59 668KB .PDF

论文研究-DTCNN的人脸识别算法的Map-Reduce并行化实现研究.pdf,  传统人脸识别算法都采用基于特征提取的解决方案,所以有效的特征需要很强的先验知识和丰富的工程经验.本文引入深度平 铺卷积神经网络(deep tiled convolutional neural networks,DTCNN),利用深度平铺卷积神经网络的特征学习能力来实现 人脸识别,可是由于深度平铺卷积神经网络的
增刊 郭礼华,等: DTCNN的人脸识别算法的 Map-Rcducc并行化实现研究 285 22Map- Reduce并行化实现 当深度神经卷积神经网络处理大量的人脸图像数据时,其训练时间过长,训练过程会占用很大的内存空 间,本文提出一种在云计算的环境下,基于 Map-reducc的 Dccp Tiled CNNs算法 MR-DTCNN(Map Reduce based deep tiled convolutional neural networks). MR-DTCNN的基本思想分为两部分处理过程, 首先根据输入数据在网络中的位置进行分片,并且根据 Tiled cnns算法计算分片网络权值的一次迭代结果, 然后将得到的结果在整个网络进行更新,继续进行下一次的迭代和更新,直到寻找到网络权值的最优解.我 们提出的并行化方法基于 Hadoop平台,首先输入数据,简单层和抽取层共同搭建了一个三层的 Tiled cnns 网络,加入深度学习概念后,得到一个九层的网络结构(本文深度学习层次采用3层),根据每个节点所在的 位置进行分片,然后将拆分后的M个独立分片送给Map函数进行处理,Map函数实现是利用TICA算法, 通过梯度下降的方法迭代找到分片内的权值分配情况,将一次梯度下降算法得到的结果记为(key, value),其 中key代表权值对应位置坐标,如连接第一层第二个输入点和第二层第一个输λ点的权值记为W21, valuc 值为权值的大小,其中给首次给Map函数输入的键值对为随机得到的初始化键值对.然后保存由M个分片 计算得到的(key, value)键值对.接下来将由Map函数经过一次迭代得到的键值对输入给 Reduce函数进行 统计更新, Reduce函数对输入的权值进行更新,使得整个网络的权值都得到更新.然后继续重复以上权值计 算更新过程,通过几次迭代后,找到日标函数的最有解,得到网络的权值分布 3实验和结果分析 本文实验采用3台普通台式机,其硬件配置如下:i7的处理器,8G内存、1T的硬盘,三台机器都作为 Datanode和 Task Tracker,并且选择其中一台机器还充当 NameNode和 Job Tracker的作用. Hadoop版本 采用目前为止最新的稳定版1.0.4 目前也有一些公开的测试人脸数据库,如ORI人脸数据库,由剑桥大学AT&T实验室创建,包含40 人共400张面部图像,部分志愿者的图像包括了姿态、表情和面部饰物的变化.LFW数据库10,其是目前 公认的最有挑战的数据库,原数据包含来自5749个不同个体的13233张图片,每个个体的图片数一般不同, 最少的有一张照片,多的可达500多张,可是为了能更好地推广到实际系统,本文用的数据集是由抓图软 件从网络视频中截取的人脸和非人脸图片,共82248张,其中人脸图片42000张,非人脸图片40248张,构成 S-FACE数据库.其比最有挑战的LFW数据库还要大6倍多.我们随机将 S-FACE数据库分成5份,其中 80%的数据作为训练数据集,而剩下的20%的数据作为测试数据集,系统还采用5折交义验让,最终的测试 性能选取测试数据集上系统识别的准确率指标 首先比较各种平铺结构和图层结构对识别性能的影响,我们选用∫两科图层结构分别是3层图层和6层 图层,然后平铺结构从1~25测试系统的识别率,在 S-FACE数据库上识别准确率如图2所示.对比特征图 层个数当特征图层个数为6时,识别率达到最高点,说明图层个数的增加有助于获得多样性的特征,从而帮 助提高性能.观察图2还可以发现,特征图层选3时,识别率在 tile size取2时达到最高点,以2为分界点 两侧逐渐递减;而特征图层选6时,识别卒在 tile size取5时达到最高点,并且以5为分界点两侧逐渐递减. 这表明当选取 tile size接近特征图层个数时,对于提高网络的识别率是有益的 准 率 表1基于相同数据库下不同人脸识别算法准确率 6 Maps 算法 识别准确率 83 Tiled cnns 94.38% 本文的三层Tild 9438 Tile si Haar特征 94.38% 图2 Tiled cnns结构改变特征图层和 Tile size的准确率 下面测试S-FACE数据库不同网络结构以及与经典的Har特征人脸识别算法1的性能对比,表1给 出了S-FACE数据库的识别准确度,从实验结果中可以看出,在 S-FACE数据库上,经典的Har特征人脸识 别算法叫的识别率仅为91%,比 Tiled CNns的识别率低3.72%,而三层的Tled识别性能最好,为9472% 为了测试基于 Map-Reduce并行化方法的网络实现过是否有提高训练效率,以及评估对训练速率改善的 百分比.本文设计了以下对比实验,将 Deep Tiled CNNs网络放在三种模式下训练.其中实验所需的海量数 286 系统工程理论与实践 第34卷 据是从 S-FACE数据库选取的,第一种模式我们选取其中4016张图像、其数据大小为100M字节;第二种模 式选用41124张图像,其数据大小为1G字节;第三种模式全郾选取S-FACE数据库的82248张图像,其数 据大小为2G统计第一次迭代的所需时间,实验中的数据均是在同等条件下进行的十次实验的平均值,测试 结果如表2所示其训练耗时如图3所示.从表1和图3的结果可以看出,使用 Map-Reduce能很好地实现 并行化效果,并且极大改善了训练速率 600 表2海量数据训陈练时长测试 500 测试数图片单机用时双机用时三台机器 台机器 据大小数量 秒) 秒)用时(秒) ■两台机器 100M4016 54 55 53 200 ■二台机器 4|124 195 124 100 2G82248638 312 267 100M IG 2G 图3训练时长对比图 4结论 本文对基于Map- Reduce下的平铺卷积神经网络算法进行了斫究,提出了一种适应于海量数据的并行化 Map-Rcducc实现基于深度平铺卷积神经网络的人脸识别算法( MR-DTCNN),此算法在大数据的SFac数 据厍上进行测试,测试结果表明,其性能比经典的基于har特征的人睑识别性能要高3.72%,并且由于采用 了Map- Reduce的并行化的机制,该算法不仪有效地降低了训练耗时,同时也改善了内存占用问题,对于网 络实现有显著帮助,具有现实应用意义 参考文献 l]挛文辉,高璐,林逸峰,等.特征选择模糊加权多通道 Gabor人脸识别问],淌南大学学报:自然科学版,2013,40(4) Li Wenhui, Gao L 1l, Lin Yifeng, et aL. Feature select ion fuzzy weight.ed Multi-Gabor face recognition [J]. ournal of Hunan University: Natural Sciences, 2013, 10(1):87-93 巴2]戴金波,肖霄,赵宏伟.基亍低分辨率局部二值模式的人脸识别[J.吉林大学学报,2013,43(2):435-438 Dai Jinbo, Xiao Xiao, Zhao Hongwei. Human face recognition based on low resolution local binary patternJ Journal of jinlin University, 2013, 43(2) :435-438 B]郭礼华,白洋,金连文.PHOG特征与聚类特征选择的笑脸识别方法J模式识别与人工智能,2012,25(1):28328. Guo lihua, Bai Yang, Jin Lianwell. Smile recognition based on PHOG feature extraction and clustering feature selectionJ] Pattern Recognition and Artificial Intelligence, 2012, 25(1): 23-28 4 Turk M, Pentland A. Facc rccognition using cigcnfaces[C//CVPR, 1991: 586-591 5 Belhumeur P, Hespanha Kriegman D. Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection[J. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997, 19 (7):711-720 6 Chen C F, Wei P, Wang YC F. Low-rank matrix recovery with structural incoherence for robust face recog nition C//CvPR,2012:26182625 7 LeQ V, Ngiam J. Chen Z. Tiled convolutional neural network Cl// NIPS, 2010 8 Venkatraman S, Kulkarni s. MapReduce, neural network framework for efficient content based image retrieval from large datasets in the cloud[Cl// 2012 12th International Confcrcncc on Hybrid Intelligent Systems(HIS 2012 9http://www.cl.cam.ac.lk/research/dtg/atta.rchive/facedatabase.html.[2013-07-10 10 Huang G B, Mattar M, Berg T, et al. Labeled faces in the wild: A database for studying face recognition in unconstrained environments R. TechReport, 2007 11 Viola P, Jones M. Rapid object detection using a boosted cascade of simple features Cl// CVPR, 2001: 511-518

...展开详情
img
  • 至尊王者

    成功上传501个资源即可获取

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐