1
碎纸片的拼接复原
摘 要
本文运用左右边界匹配、 图片特征匹配、上下边界匹配等方法研究单页打印纵切纸
片、单页打印横、纵切纸片以及双页打印横、纵切纸片的拼接与复原问题。
针对问题一,首先对图像进行数据处理, 读取图片的灰度信息, 构建灰度矩阵, 并
将灰度矩阵转化为 0- 1
矩阵, 从而将二维图片数值化。 接着, 提取出 0- 1 矩阵的第一列
与最后一列,存储在图片的左右边界矩阵中, 通过建立两张图片的左右边界匹配度模型,
探究图片的左右邻接关系。计算结果为:汉字图片从左到右依次为:008 、014 、012 、
015 、003 、010 、002 、016 、001 、004 、005 、009 、013 、018 、011 、007 、017 、000、
006 ,英文的排序结果为:003 、006 、002 、007 、015 、018 、011 、000 、005 、001 、009、
013 、010 、008 、012 、014 、017 、016 、004。
问题二, 采用二层筛选的方法, 第一层做行位置筛选, 读取图片的前 100 个像素行,
存入图片的特征列向量中, 并将此列向量作为行特征的唯一标识, 建立图片的特征匹配
模型, 将列向量元素差异最小的图片聚类,中文确定出 15 类,英文归为 16 类。然后通
过人为干预, 实现类的合并, 使每类中的图片个数相同, 将中英文都聚成 11 类,每一
类包含 19 张图片。 构建行内图片的左右边界匹配模型, 最终确定出每类内部图片的排
序;第二层做列位置筛选,建立每行上下边界匹配模型,得出在各行的上下位置序列,
经过两层筛选, 得出原文件图片序列。 最后, 视人工干预后的最终结果为正确答案, 检
验未加入人工干预计算机排序结果, 得到中文的拼接正确率为90.4%,英文的拼接正确
率为 65.1%。
对于问题三, 建立两次特征匹配模型将图片聚类,即首先任取一碎片的一面依次与
其他碎片的两个面分别作第一次特征匹配, 寻得与该面特征匹配程度高的另一碎片的一
面, 再将这两个碎片的另一面做第二次特征匹配, 在两者匹配很好的前提下, 探求出两
碎片的确定面属于同一类。 加入人工干预, 对类的个数降维, 并保证每类中图片的数量
相同。 再利用问题二中的模型构建方法, 通过左右边界匹配模型的求解、上下边界匹配
模型的构建方法, 完成了本问的研究。 最后, 我们从问题二的模型多增加一层特征匹配
约束可得到问题三的模型这一角度出发,得出了模型三的拼接精度更高这一结论。
本文综合各种匹配方法, 根据问题的深入, 对匹配模型加以不断的改进, 结合 matlab
编程、 word 拼图等手段,对碎纸片的拼接复原做了逐步深入分析,并给出了基于边界
灰度、图片行特征灰度的匹配模型。在文章的最后对模型的适用范围做出了推广, 在实
际应用中有较大的参考价值。
关键词:左右边界匹配 特征匹配 上下边界匹配 matlab 两层筛选