基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.zip_基于matlab的图像拼接复原技术资源-CSDN文库

共16个文件

m：14个

ds_store：1个

docx：1个

版权申诉

matlab

优化设计

33 浏览量 2024-05-02 16:59:20 上传评论收藏 410KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.zip （16个子文件）

.DS_Store 6KB

基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.docx 477KB

数据及源程序

问题二的程序

附件四的程序

jz01zh.m 241B

jl_4.m 801B

tiqushuju_4.m 611B

hangpaixu_4.m 2KB

附件三的程序

hangpaixu.m 2KB

jl.m 649B

jz01zh.m 241B

tiqushuju.m 611B

问题一的程序

jz01zh.m 241B

sortpicture.m 603B

boundary.m 407B

问题三的程序

jz01zh.m 241B

tiqushuju_5.m 1KB

fenhang.m 1KB

碎纸片的拼接复原

摘要

本文运用左右边界匹配、图片特征匹配、上下边界匹配等方法研究单页打印纵切纸

片、单页打印横、纵切纸片以及双页打印横、纵切纸片的拼接与复原问题。

针对问题一，首先对图像进行数据处理，读取图片的灰度信息，构建灰度矩阵，并

将灰度矩阵转化为 0- 1

矩阵，从而将二维图片数值化。接着，提取出 0- 1 矩阵的第一列

与最后一列，存储在图片的左右边界矩阵中，通过建立两张图片的左右边界匹配度模型，

探究图片的左右邻接关系。计算结果为：汉字图片从左到右依次为：008 、014 、012 、

015 、003 、010 、002 、016 、001 、004 、005 、009 、013 、018 、011 、007 、017 、000、

006 ，英文的排序结果为：003 、006 、002 、007 、015 、018 、011 、000 、005 、001 、009、

013 、010 、008 、012 、014 、017 、016 、004。

问题二，采用二层筛选的方法，第一层做行位置筛选，读取图片的前 100 个像素行，

存入图片的特征列向量中，并将此列向量作为行特征的唯一标识，建立图片的特征匹配

模型，将列向量元素差异最小的图片聚类，中文确定出 15 类，英文归为 16 类。然后通

过人为干预，实现类的合并，使每类中的图片个数相同，将中英文都聚成 11 类，每一

类包含 19 张图片。构建行内图片的左右边界匹配模型，最终确定出每类内部图片的排

序；第二层做列位置筛选，建立每行上下边界匹配模型，得出在各行的上下位置序列，

经过两层筛选，得出原文件图片序列。最后，视人工干预后的最终结果为正确答案，检

验未加入人工干预计算机排序结果，得到中文的拼接正确率为90.4%，英文的拼接正确

率为 65.1%。

对于问题三，建立两次特征匹配模型将图片聚类，即首先任取一碎片的一面依次与

其他碎片的两个面分别作第一次特征匹配，寻得与该面特征匹配程度高的另一碎片的一

面，再将这两个碎片的另一面做第二次特征匹配，在两者匹配很好的前提下，探求出两

碎片的确定面属于同一类。加入人工干预，对类的个数降维，并保证每类中图片的数量

相同。再利用问题二中的模型构建方法，通过左右边界匹配模型的求解、上下边界匹配

模型的构建方法，完成了本问的研究。最后，我们从问题二的模型多增加一层特征匹配

约束可得到问题三的模型这一角度出发，得出了模型三的拼接精度更高这一结论。

本文综合各种匹配方法，根据问题的深入，对匹配模型加以不断的改进，结合 matlab

编程、 word 拼图等手段，对碎纸片的拼接复原做了逐步深入分析，并给出了基于边界

灰度、图片行特征灰度的匹配模型。在文章的最后对模型的适用范围做出了推广，在实

际应用中有较大的参考价值。

关键词：左右边界匹配特征匹配上下边界匹配 matlab 两层筛选

一、问题重述

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重

要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当

碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图

开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题：

1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片

拼接复原模型和算法，并针对附件 1、附件 2 给出的中、英文各一页文件的碎片数据进

行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结

果以图片形式及规定的表格形式表达。

2. 对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附

件 3、附件 4 给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要

人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件

的碎纸片拼接复原问题需要解决。附件 5 给出的是一页英文印刷文字双面打印文件的碎

片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件 5

的碎片数据给出拼

接复原结果，结果表达要求同上。

二、问题分析

碎片的拼接复原，通常的做法是人工识别碎片边缘的字迹断线、和理解碎片内文字

含义，这样利用人工智能的方法虽然准确度高，但是当碎片的数量很大时，人工的效率

就显得低，而且出错率会明显提高；而计算机拼接与复原图像，虽不及人工识别智能，

但能充分发挥其运算量大，运算速度快的特点。

故本问题的目标就是利用附件中给的碎片数据，分单页纵切，单页横纵切，双页打

印横纵切三种情况，把拼接复原问题抽象成一个明确完整的数学模型，利用计算机，并

加以人工干预，复原出原图表。

问题一的分析

问题一要求仅考虑单面纵切，建立来自同一页印刷文字文件的碎纸机破碎的纵切纸

片拼接复原模型和算法。通过对附件 1 和附件 2 给出的碎片数据图的观察，发现本题的

碎片图像具有相对文字（汉字、英文）方向纵向规则剪开的特征，所以不适合基于碎片

的边缘线建模，也不适合基于两幅图片的重合度建模。我们可以根据打印文件的每行文

件具有前后连续性，考虑先从读取文件数据入手，存储每幅图片对应的灰度值矩阵。依

靠得到的灰度值矩阵转化为 0- 1 二值矩阵，并利用相邻接左右边界差异不大这一特性作

为依据来建立左右边界匹配模型，来解决此问题，复原出图片的原始序列。

问题二的分析

此题加入了横向切割，使得切割方式更加多样化和更接近实际。它相对于第一问而

言，图片的信息量更小，图片的个数增多了一倍。图片总体不仅在纵向具有无序性，而

且在横向也具有无序性。若仅采用问题一中的方法，定位约束太少，可能会出现一个图

片与多个图片最小差异度相等，导致该图片与多个图片相联系，从而增加问题求解的难

度。通过观察图片的平行切割特点，发现来自原文件同一行的文字切割后的图片一般在

相同的行位置上。所以可以考虑，先进行行位置筛选，通过构建图片的特征列向量作为

唯一标识，建立特征匹配模型，得到具有相同行特征的图片，聚成同一类。考虑到每类

包含的图片个数不一致，可加入人工干预，对类的个数降维，使得行集合包含的碎片个

数一致。而利用左右边界匹配模型可以确定同一行的图片的序列；可采用相同的原理，

建立上下边界匹配模型来解决纵向图片的定序问题。这样一来，可以拼接出本问的原文

件，完成问题二的求解。

问题三的分析

问题三在前两问的基础上，加入了双面打印这一条件。本问中图片的个数相较于问

题二增大了一倍，达 2 11 19 418 个，较前两问复杂度最高。由于从单面看问题二和

问题三没有任何区别，所以可以采取相似的方法对问题三求解。但我们思考总结出如下

两方面：一方面不能思维定势，也就是说所有编号中带有 a 的图不一定都来自同一面，

即有可能是碎纸片的正面也有可能是碎纸片的反面。另一方面如果采用问题二中相同的

处理方法对附件 5

中所有的图片排序的话，可能会发生一个图片的匹配图片过多，或者

出现将一个碎纸片的正反面归为同一类的错误。综合以上两方面的思考，问题三的求解

过程的特点在于：先对一张碎纸片构建其对应的特征匹配模型，若得到另外一张碎纸片

与这张碎纸片匹配，则随后对它们的反面进行匹配以检验。

三、模型假设

1.假设附件中每张碎纸片都是大小相等的矩形，切割边缘光滑；

2.假设附件中编号为 000 的图片为第一张图片，编号为 001 的图片为第二张图片，依此

类推；

3.假设附件中每张图片无倾斜，即底边水平；

4.假设附件中的每张图片是无噪的，仅考虑图像的拼接无须考虑图像的修补；

5.假设每一附件为同一页纸的碎片数据；

6.假设包含 000a

图片的那页为原文件的正面

四、符号说明与名称解释

4.1 符号说明

(k)

：第k 张图片的灰度值矩阵

)

：第k 张图片的灰度值矩阵的第i 行第j 列的元素

(k)

：第k 张图片的灰度值矩阵转化的 0- 1 矩阵

)

：第k 张图片 0- 1 矩阵的第i 行第j 列的元素

(k)

：第k 张图片左、右边界线上的 0- 1 边界矩阵

k s

：第k 张图片右边界与第s 张图片的左边界的边界匹配值

：第k 张图片左边界与第s 张图片的右边界的边界匹配值

：第k 张图片左右边界匹配时最优的匹配值

(k)

：存入特征灰度信息的的特征列向量

(k)

：第k 张图片灰度信息特征列向量

k ,s

：反映图片k 及图片s

的特征信息吻合程度的特征值

4.2 名称解释

1.原文件：每个附件中所有图片拼接复原图；

2.图片行：以附件中各个图片为单位组成的行；

3.文字行：以图片内部文字为单位组成的行；

4.像素行：图片内部像素矩阵的行；

5.行集合：具有相同行特征的碎片组成的图片行。

五、模型的建立与求解

5.1 问题一的模型建立与求解

问题一要求拼接复原来自同一页纵切的破碎纸片。这个问题仅在纵向的维度对碎纸

片的拼接复原提出了要求，对此本文从以下三个步骤进行回答：

步骤一：读取每张图片文件的数据，其目的是将附件中给的 bmp 格式的碎纸片图以

灰度值矩阵的形式存储。再将灰度值矩阵转化为 0- 1 矩阵，来得到模型的数据基础；

步骤二：基于上述 0- 1

矩阵，提取每幅图片左右边界的 0- 1 值，建立左右边界匹配

模型，确定出图片的序列；

步骤三：根据上面的步骤，将附件图片拼接，以图片和表格形式展现。

5.1.1 图像的数据处理

Step1.灰度值矩阵的获取

[1]

附件中无论印有汉字还是英文的碎纸片均以 bmp 格式的图片形式给出。先将附件中

的图片以元胞矩阵的形式存入 matlab 中

为建立模型，必须得到数字依据。

所以用 matlab

的 imread 函数读取图片的灰度信息，将第k 张图片的灰度信息分别

存入灰度值矩阵A

(k)

中(k 1,2 19) ：

(k)

)

其中，第k 个图片的灰度信息以 0~255

的灰度值存储在矩阵A

(k)

中，颜色越深，灰

度值越大。

Step2. 0- 1 矩阵的建立

由于 matlab 在计算时，为防止灰度值溢出，会将值限制在 0~255 的范围内。在此模

型的计算中，为保证灰度匹配模型中绝对值的和不受这个约束的影响，同时简便计算，

需将灰度值矩阵A

(k)

进行转化为 0- 1 矩阵C

(k)

(k 1,2 19) ，具体转化操作如下：

若A

(k)

中某个元素灰度值a

)

小于 255，则 C

(k)

中相同位置的元素值c

)

记为 0，否则

记为 1。即：

)

于是，建立了 0- 1 矩阵C

(k)

：

)

Step3：获取左、右边界矩阵

)

255

)

255

)

（5.1）

)

0，

1，

)

(k)

评论收藏

内容反馈

版权申诉

小码蚁.

粉丝: 2584
资源: 4344

基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.zip

基于MATLAB的碎纸片拼接复原技术研究

基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.docx

基于旅行商模型的文字碎纸片拼接复原方案内含数据集和源码.zip

基于matlab的碎纸片的拼接复原内含数据集以及说明书.zip

基于matlab的碎纸片的拼接复原内含数据集以及说明书.docx

基于MATLAB的小波变换图像拼接技术（GUI+源码）.zip

基于matlab的SVM的手写字体识别内含数据集和源码.zip

基于matlab的高温作业专用服装设计内含数据集和源码 .zip

基于matlab的遗传算法内含数据集和教程.zip

基于matlab的SVM分类与回归内含数据集和源码.zip

基于matlab的LIBSVM参数实例内含数据集和源码.zip

基于matlab的SVM的图像分割-真彩色图像分割内含数据集和源码.zip

基于matlab的LVQ神经网络的分类-乳腺肿瘤诊断内含数据集和源码.zip

基于matlab的瑞利衰落和莱斯衰落信道模型内含数据集和教程.zip

基于matlab的汽车总装线配置优化方案内含数据集和源码.zip

基于matlab的动态神经网络时间序列预测研究-基于MATLAB的NARX实现内含数据集和源码.zip

基于matlab的Kohonen网络的聚类算法-网络入侵聚类内含数据集和源码.zip

基于matlab的LVQ神经网络的预测-人脸朝向识别内含数据集和源码.zip

基于matlab的BP神经网络的数据分类-语音特征信号分类内含数据集和源码.zip

LSTM时间序列神经网络预测MATLAB代码

Matlab 基于BP神经网络的数据分类预测 BP分类

Matlab 基于支持向量机(SVM)的数据回归预测 SVM回归

ADRC控制器仿真 simulink 2017a版本

2022建模国赛代码(三天坚持不易) 包括K-meas算法、bp预测、回归预测,(python和matlab做的).zip

matlab2020b ubuntu.txt

基于蚁群算法的三维路径规划(matlab实现)

信号分选SDIF序列差直方图算法matlab仿真程序

基于智能优化算法的双层优化求解(matlab代码)

调频连续波（FMCW）雷达二维FFT代码matlab

最新资源