基于Python的PCA人脸识别算法的原理及实现代码详解.zip_基于pca算法的人脸识别python,人脸识别pca算法python资源-CSDN文库

共21个文件

png：16个

py：4个

rar：1个

版权申诉

python

开发语言

5星 · 超过95%的资源 192 浏览量 2022-04-22 16:04:48 上传评论 34 收藏 3.75MB ZIP 举报

PCA（主成分分析）是一种广泛应用于数据降维的统计学方法，它通过线性变换将原始数据转换为一组各维度线性无关的表示，从而达到减少数据维度、降低复杂度、提取主要特征信息的目的。在人脸识别领域，PCA常用于识别面部特征，因为它能够将复杂的面部图像信息压缩到较少的维度，同时保留关键的面部特征。本项目基于Python实现了PCA人脸识别算法，适合大学生进行课程设计学习。Python作为一门简洁易读的编程语言，是进行数据分析和机器学习的良好选择。在这个项目中，我们将会涉及到以下几个知识点： 1. **numpy库**：在Python中，numpy是处理数组和矩阵运算的核心库。PCA的计算过程中会涉及大量的矩阵操作，如矩阵乘法、求逆等，因此numpy是实现PCA必不可少的工具。 2. **数据预处理**：在进行PCA之前，通常需要对数据进行预处理，包括归一化或标准化，使得所有特征具有相同的尺度，避免因数值差异导致的权重不平等。 3. **PCA算法**： - **计算协方差矩阵**：PCA的关键在于找到数据的最佳低秩近似。我们需要计算数据的协方差矩阵，这反映了特征之间的相关性。 - **特征值分解**：协方差矩阵进行特征值分解，得到特征值和对应的特征向量。特征值表示每个主成分的重要性，特征向量代表了主成分的方向。 - **选择主成分**：选取具有最大特征值的特征向量作为主成分，这些主成分能够解释原始数据的大部分方差。 - **投影与降维**：将原始数据投影到由主成分构成的新坐标系中，达到降维的目的。 4. **OpenCV库**：OpenCV是一个强大的计算机视觉库，包含多种图像处理和计算机视觉功能。在这个项目中，可能用OpenCV来读取、预处理和显示图像，以及提取人脸区域。 5. **图像处理**：在人脸识别中，通常需要先进行图像灰度化、直方图均衡化等预处理步骤，以便更好地提取面部特征。 6. **特征脸（Eigenface）**：PCA在人脸识别中的应用也被称为“特征脸”方法。通过PCA得到的主成分可以被视为一组“特征脸”，它们是原始人脸图像的线性组合，代表了人脸的主要特征模式。 7. **识别过程**：训练阶段，PCA用于提取训练集的人脸特征；测试阶段，新的人脸图像同样经过PCA降维，然后与训练集的特征脸进行比较，通过某种相似度度量（如欧氏距离）来确定最匹配的样本，从而实现人脸识别。 8. **代码实现**：项目代码应该包含了数据加载、预处理、PCA计算、降维、特征脸构建、识别过程等多个模块，有助于理解PCA算法的完整流程。这个课程设计项目将帮助学生深入理解PCA算法，掌握Python编程和数据分析技能，同时也能了解人脸识别的基本原理和应用。通过实践，学生将能更好地将理论知识与实际问题相结合，提高解决问题的能力。

资源推荐

资源详情

资源评论

收起资源包目录

基于Python的PCA人脸识别算法的原理及实现代码详解.zip （21个子文件）

PCA-Principal-Components-Analysis-master

image

11.png 15KB

6.PNG 7KB

16.png 22KB

5.PNG 3KB

10.png 54KB

1.PNG 2KB

4.PNG 4KB

14.png 21KB

9.PNG 4KB

3.PNG 3KB

2.PNG 4KB

12.png 13KB

7.png 7KB

13.png 19KB

8.png 18KB

15.png 22KB

example_1.py 2KB

shuzu_action.py 922B

ORL.rar 3.79MB

PCA_face_recongize.py 4KB

PCA_algorithm.py 7KB

# coding:utf-8 import os from numpy import * import numpy as np import cv2 import matplotlib.pyplot as plt from pylab import mpl mpl.rcParams['font.sans-serif'] = ['SimHei'] # 图片矢量化 def img2vector(image): img = cv2.imread(image, 0) # 读取图片 rows, cols = img.shape imgVector = np.zeros((1, rows * cols)) imgVector = np.reshape(img, (1, rows * cols)) return imgVector orlpath = "E:/face_recongize/ORL" # 读入人脸库,每个人随机选择k张作为训练集,其余构成测试集 def load_orl(k): ''' 对训练数据集进行数组初始化，用0填充，每张图片尺寸都定为112*92, 现在共有40个人，每个人都选择k张，则整个训练集大小为40*k,112*92 ''' train_face = np.zeros((40 * k, 112 * 92)) train_label = np.zeros(40 * k) # [0,0,.....0](共40*k个0) test_face = np.zeros((40 * (10 - k), 112 * 92)) test_label = np.zeros(40 * (10 - k)) # sample=random.sample(range(10),k)#每个人都有的10张照片中，随机选取k张作为训练样本(10个里面随机选取K个成为一个列表) sample = random.permutation(10) + 1 # 随机排序1-10 (0-9）+1 for i in range(40): # 共有40个人 people_num = i + 1 for j in range(10): # 每个人都有10张照片 image = orlpath + '/s' + str(people_num) + '/' + str(sample[j]) + '.jpg' # 读取图片并进行矢量化 img = img2vector(image) if j < k: # 构成训练集 train_face[i * k + j, :] = img train_label[i * k + j] = people_num else: # 构成测试集 test_face[i * (10 - k) + (j - k), :] = img test_label[i * (10 - k) + (j - k)] = people_num return train_face, train_label, test_face, test_label # 定义PCA算法 def PCA(data, r): data = np.float32(np.mat(data)) rows, cols = np.shape(data) data_mean = np.mean(data, 0) # 对列求平均值 A = data - np.tile(data_mean, (rows, 1)) # 将所有样例减去对应均值得到A C = A * A.T # 得到协方差矩阵 D, V = np.linalg.eig(C) # 求协方差矩阵的特征值和特征向量 V_r = V[:, 0:r] # 按列取前r个特征向量 V_r = A.T * V_r # 小矩阵特征向量向大矩阵特征向量过渡 for i in range(r): V_r[:, i] = V_r[:, i] / np.linalg.norm(V_r[:, i]) # 特征向量归一化 final_data = A * V_r return final_data, data_mean, V_r # 人脸识别 def face_rec(): # k=int(input("每个人选择几张照片进行训练：")) # x_value=[] # y_value=[] for r in range(10, 41, 10): # 最多降到40维,即选取前40个主成分（因为当k=1时，只有40维) print("当降维到%d时" % (r)) x_value = [] y_value = [] for k in range(1, 10): train_face, train_label, test_face, test_label = load_orl(k) # 得到数据集 # 利用PCA算法进行训练 data_train_new, data_mean, V_r = PCA(train_face, r) num_train = data_train_new.shape[0] # 训练脸总数 num_test = test_face.shape[0] # 测试脸总数 temp_face = test_face - np.tile(data_mean, (num_test, 1)) data_test_new = temp_face * V_r # 得到测试脸在特征向量下的数据 data_test_new = np.array(data_test_new) # mat change to array data_train_new = np.array(data_train_new) # 测试准确度 true_num = 0 for i in range(num_test): testFace = data_test_new[i, :] diffMat = data_train_new - np.tile(testFace, (num_train, 1)) # 训练数据与测试脸之间距离 sqDiffMat = diffMat ** 2 sqDistances = sqDiffMat.sum(axis=1) # 按行求和 sortedDistIndicies = sqDistances.argsort() # 对向量从小到大排序，使用的是索引值,得到一个向量 indexMin = sortedDistIndicies[0] # 距离最近的索引 if train_label[indexMin] == test_label[i]: true_num += 1 else: pass accuracy = float(true_num) / num_test x_value.append(k) y_value.append(round(accuracy, 2)) print('当每个人选择%d张照片进行训练时，The classify accuracy is: %.2f%%' % (k, accuracy * 100)) # 绘图 if r == 10: y1_value = y_value plt.plot(x_value, y_value, marker="o", markerfacecolor="red") for a, b in zip(x_value, y_value): plt.text(a, b, (a, b), ha='center', va='bottom', fontsize=10) plt.title("降到10维时识别准确率", fontsize=14) plt.xlabel("K值", fontsize=14) plt.ylabel("准确率", fontsize=14) plt.show() # print ('y1_value',y1_value) if r == 20: y2_value = y_value plt.plot(x_value, y2_value, marker="o", markerfacecolor="red") for a, b in zip(x_value, y_value): plt.text(a, b, (a, b), ha='center', va='bottom', fontsize=10) plt.title("降到20维时识别准确率", fontsize=14) plt.xlabel("K值", fontsize=14) plt.ylabel("准确率", fontsize=14) plt.show() # print ('y2_value',y2_value) if r == 30: y3_value = y_value plt.plot(x_value, y3_value, marker="o", markerfacecolor="red") for a, b in zip(x_value, y_value): plt.text(a, b, (a, b), ha='center', va='bottom', fontsize=10) plt.title("降到30维时识别准确率", fontsize=14) plt.xlabel("K值", fontsize=14) plt.ylabel("准确率", fontsize=14) plt.show() # print ('y3_value',y3_value) if r == 40: y4_value = y_value plt.plot(x_value, y4_value, marker="o", markerfacecolor="red") for a, b in zip(x_value, y_value): plt.text(a, b, (a, b), ha='center', va='bottom', fontsize=10) plt.title("降到40维时识别准确率", fontsize=14) plt.xlabel("K值", fontsize=14) plt.ylabel("准确率", fontsize=14) plt.show() # print ('y4_value',y4_value) # 各维度下准确度比较 L1, = plt.plot(x_value, y1_value, marker="o", markerfacecolor="red") L2, = plt.plot(x_value, y2_value, marker="o", markerfacecolor="red") L3, = plt.plot(x_value, y3_value, marker="o", markerfacecolor="red") L4, = plt.plot(x_value, y4_value, marker="o", markerfacecolor="red") # for a, b in zip(x_value, y1_value): # plt.text(a,b,(a,b),ha='center', va='bottom', fontsize=10) plt.legend([L1, L2, L3, L4], ["降到10维", "降到20维", "降到30维", "降到40维"], loc=4) plt.title("各维度识别准确率比较", fontsize=14) plt.xlabel("K值", fontsize=14) plt.ylabel("准确率", fontsize=14) plt.show() if __name__ == '__main__': face_rec()

评论收藏

内容反馈

版权申诉