# 基于matlab采用KNN算法手写体数字识别实现
## 一、前言
- KNN 全称是 K- Nearest Neighbors ,K-近邻。简单来说,K就是邻居个数,选出和测试样本最像的邻居(这里是欧式几何距离最短的K个邻居),那么样本的邻居是什么,样本就是什么(在K个邻居里,假如邻居的标签最多的是数字1,我们就认为样本的标签就很可能是数字1)
- KNN 实现手写体识别的原理和代码都比较简单,但网上相关文章不多,本文只是把我自己的理解写下来作为学习matlab的实践,多有纰漏,请多指教
-------
## 二、实现过程
1. 处理 MNIST 数据集
- 下载 [MNIST](http://yann.lecun.com/exdb/mnist/) 数据集,下载测试集、测试标签、训练样本、训练标签共四个文件
- 下载下来的数据集是 IDX 文件格式的,因此用 Python 转为 50×50 的PNG图片,代码在后
- 选取合适数量的测试集和训练集,训练集中每个数字的训练样本数要一致
2. matlab 实现步骤(以图像分辨率为 50×50例)
- 对所有图片做二值化处理:有值取1,无值取0
- 将 0-9 数字的训练样本矩阵化,每一幅数字图像都是一维矩阵。以50×50分辨率图像为例,获得 1×2500 的一维矩阵;每个数字860张图片,我们就得到了 8600 × 2500 的矩阵,这作为训练矩阵
- 在训练矩阵加入标签列,用来判断某一行指的数字是多少
- 对每一幅待识别数字图像,同样将其转为 1 × 2500 的一维矩阵,称为测试矩阵
- 计算测试矩阵与训练矩阵每一维的欧氏几何距离,同样按列向量加到训练矩阵,并按距离升序按行排列训练矩阵
- 对前 K 个行向量求标签的众数,结果标签就是采用 KNN 算法得到的最有可能的识别结果
---
## 三、代码实现
1. **处理MINIST数据集的Python代码 感谢 [name_s_Jimmy](https://blog.csdn.net/qq_32166627) 的文章 [使用Python将MNIST数据集转化为图片](https://blog.csdn.net/qq_32166627/article/details/52640730)**
```python
import numpy as np
import struct
from PIL import Image
import os
data_file = #需要修改的路径,测试或训练样本图像,如t10k-images.idx3-ubyte或train-images.idx3-ubyte
# It's 47040016B, but we should set to 47040000B
data_file_size = 47040016
data_file_size = str(data_file_size - 16) + 'B'
data_buf = open(data_file, 'rb').read()
magic, numImages, numRows, numColumns = struct.unpack_from(
'>IIII', data_buf, 0)
datas = struct.unpack_from(
'>' + data_file_size, data_buf, struct.calcsize('>IIII'))
datas = np.array(datas).astype(np.uint8).reshape(
numImages, 1, numRows, numColumns)
label_file = #需要修改的路径,测试或训练样本标签,如t10k-labels.idx1-ubyte或train-labels.idx1-ubyte
# It's 60008B, but we should set to 60000B
label_file_size = 60008
label_file_size = str(label_file_size - 8) + 'B'
label_buf = open(label_file, 'rb').read()
magic, numLabels = struct.unpack_from('>II', label_buf, 0)
labels = struct.unpack_from(
'>' + label_file_size, label_buf, struct.calcsize('>II'))
labels = np.array(labels).astype(np.int64)
datas_root = r'C:\Users\TITAN\Desktop\KNN\test' #需要修改的路径
if not os.path.exists(datas_root):
os.mkdir(datas_root)
for i in range(10):
file_name = datas_root + os.sep + str(i)
if not os.path.exists(file_name):
os.mkdir(file_name)
for ii in range(10000):# 生成10000张测试或训练样本
img = Image.fromarray(datas[ii, 0, 0:50, 0:50])
label = labels[ii]
file_name = datas_root + os.sep + str(label) + os.sep + \
'mnist_train_' + str(ii) + '.png'
img.save(file_name)
print('Finished!')
```
----
2. **Matlab 代码**
```matlab
clc;
clear;
matrix = [];% 训练矩阵
for delta = 0:9%构建训练区样本的矩阵
label_path = strcat('C:\Users\ABC\Desktop\KNN\trian\',int2str(delta),'\');
disp(length(dir([label_path '*.png'])));
for i = 1:length(dir([label_path '*.png']))
im = imread(strcat(label_path,'\',int2str(delta),'_',int2str(i-1),'.png'));
%imshow(im);
im = imbinarize(im);%图像二值化
temp = [];
for j = 1:size(im,1)% 训练图像行向量化
temp = [temp,im(j,:)];
end
matrix = [matrix;temp];
end
end
label = [];%在标签矩阵后添加标签列向量
for i = 0:9
tem = ones(length(dir([label_path '*.png'])),1) * i;
label = [label;tem];
end
matrix = horzcat(matrix,label);%带标签列的训练矩阵
%测试对象向量
for delta = 0:9%构建测试图像的向量
test_path = strcat('C:\Users\ABC\Desktop\KNN\test\',int2str(delta),'\');
len = (length(dir([test_path '*.png'])));
disp(len);
p = 0;% 识别结果计数
for i = 1:len
vec = []; % 测试样本行向量化
test_im = imread(strcat('test2\',int2str(delta),'\',int2str(delta),'_',int2str(i-1),'.png'));
imshow(test_im);
test_im = imbinarize(test_im);
for j = 1:size(test_im,1)
vec = [vec,test_im(j,:)];
end
dis = [];
for count = 1:length(dir([label_path '*.png'])) * 10
row = matrix(count,1:end-1);% 不带标签的训练矩阵每一行向量
distance = norm(row(1,:)-vec(1,:));% 求欧氏几何距离
dis = [dis;distance(1,1)];% 距离列向量
end
test_matrix = horzcat(matrix,dis);% 加入表示距离的列向量
%排序
test_matrix = sortrows(test_matrix,size(test_matrix,2));
%输入K值,前K个行向量标签的众数作为结果输出
K = 5;
result = mode(test_matrix(1:K,end-1));
disp(strcat('图像',int2str(delta),'_',int2str(i),'.png','的识别结果是:',int2str(result)));
if(delta == result)
p = p + 1;
end
end
pi = p/len;
disp(strcat('识别精度为:',num2str(pi)));
disp('Finished!');
end
```
----
## 四、结果
- 采用 KNN (最近邻) 算法实现手写数字体的识别,经测试在 K = 5,训练样本 8600 的 条件下,总体精度在0.9以上,个别数字比如 8 识别就比较差只有 0.8 左右
- KNN 算法简单,但缺点也比较明显,运行时间长,容易收敛于局部值,精度不高。
- 提高训练样本数量,调整K值,在执行算法前对图像做初步处理可能会有更好的表现
----
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计&课设-基于matlab采用K-近邻算法实现MNIST手写体数据集的识别.zip (2000个子文件)
KNN.m 2KB
readme.md 7KB
8_176.png 1KB
8_77.png 1KB
8_403.png 1KB
8_449.png 1KB
8_390.png 1KB
8_317.png 1KB
8_388.png 1KB
0_339.png 1KB
8_386.png 1KB
0_338.png 1KB
0_831.png 1KB
8_852.png 1KB
0_342.png 1KB
8_53.png 1KB
8_807.png 1KB
0_684.png 1KB
8_547.png 1KB
8_389.png 1KB
8_654.png 1KB
0_593.png 1KB
0_169.png 1KB
8_170.png 1KB
0_387.png 1KB
0_221.png 1KB
0_29.png 1KB
8_714.png 1KB
8_459.png 1KB
8_401.png 1KB
8_465.png 1KB
0_336.png 1KB
0_648.png 1KB
0_457.png 1KB
0_444.png 1KB
0_162.png 1KB
8_572.png 1KB
0_153.png 1KB
8_162.png 1KB
8_400.png 1KB
0_725.png 1KB
0_160.png 1KB
8_173.png 1KB
8_387.png 1KB
8_282.png 1KB
0_692.png 1024B
0_125.png 1024B
8_164.png 1024B
0_556.png 1023B
8_394.png 1023B
8_114.png 1023B
0_341.png 1022B
0_268.png 1021B
8_264.png 1021B
8_635.png 1020B
0_808.png 1015B
0_666.png 1014B
0_517.png 1014B
0_201.png 1014B
0_652.png 1013B
0_678.png 1013B
0_763.png 1011B
0_651.png 1011B
0_25.png 1010B
0_281.png 1010B
8_823.png 1010B
8_392.png 1010B
0_788.png 1009B
0_845.png 1009B
0_272.png 1009B
8_32.png 1009B
0_26.png 1008B
8_516.png 1008B
0_381.png 1007B
0_744.png 1007B
8_277.png 1007B
8_168.png 1007B
0_103.png 1006B
8_289.png 1006B
8_110.png 1006B
8_180.png 1006B
0_45.png 1005B
0_287.png 1005B
0_431.png 1004B
0_292.png 1004B
8_598.png 1004B
0_577.png 1003B
0_622.png 1002B
0_386.png 1002B
0_416.png 1002B
0_335.png 1002B
0_445.png 1002B
0_421.png 1001B
0_691.png 1001B
0_128.png 1000B
0_270.png 1000B
0_571.png 1000B
8_796.png 1000B
0_129.png 999B
0_413.png 999B
共 2000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
毕业小助手
- 粉丝: 2746
- 资源: 5583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 中国光伏电站安装时间的多边形地理空间数据集(2010-2022年)-最新出炉.zip
- 几种常见简单滤波器用于二维图像降噪,包括均值、中值、高斯、低通、双边滤波器,语言是python
- 二手车管理系统,pc端,小程序端,java后端
- 2011-2022年中国光伏电站遥感识别面矢量数据-最新出炉.zip
- 基于深度学习的边缘计算网络的卸载优化及资源优化python源码+文档说明(高分项目)
- 基于yolov5+超声图像的钢轨缺陷检测python源码+数据集(高分毕设)
- 基于大语言模型的智能审计问答系统python源码+文档说明(高分项目)
- C++程序设计编程题库
- javase停车场管理系统答辩PPT(高级版)
- javase的停车场管理系统(高级版)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功