基于matlab的碎纸片的拼接复原内含数据集以及说明书.docx资源-CSDN文库

版权申诉

161 浏览量 2024-05-02 18:08:22 上传评论收藏 444KB DOCX 举报

资源推荐

资源详情

资源评论

碎纸片的拼接复原

摘要

本文针对附件1至附件5中经过碎纸机破碎后的各类纸片，设计不同的模型和算法，复

原碎片。主要利用碎片间差异度大的特征构造特征因子，来描述碎片的行列特征，用以比

较、分类、匹配。

问题一，对仅纵切碎片提取左右边界差异。将碎片用矩阵表示，将边界列向量视

为1980维空间中的点，在两点间定义绝对值距离用以描述碎片边缘的匹配程度。两点间

的绝对值距离越大表示碎片匹配程度越低，两点间的绝对值距离越小表示碎片匹配程度

越高。在此定义基础上建立最优化模型，寻找和待匹配碎片距离最小的碎片与之相邻。按

照此法依次从左至右找到相邻碎片，最终复原碎片，并且不用人工干预。

问题二，经过横纵切后的碎片左右边界差异不如问题一明显，故构造新的特征因子

记录碎片空白行的宽度和位置信息。先找出位于文章最左端的11个碎片，根据空白行的

特征为余下碎片找到同行的18个碎片。从最左端的11个碎片开始利用图论中寻找权值最

小哈密尔顿路径的相关理论以及最优化理论向右复原整行碎片，得到11条只有横切的碎

片条。再根据上下端特征，利用与问题一相似方法，并配合少量的人工干预复原全文。

问题三，先对英文碎片进行预处理，抹掉每个字母的“长比划”,得到空白行较为规

整的碎片，方便提取空白行特征信息。再定义四个行特征因子：

θ₁为从碎片顶端像素开始向下连续白像素的个数。

0₂为从碎片底端像素开始向上连续白像素的个数。

m 为从碎片顶端像素开始向下连续黑像素的个数。

n₂为从碎片底端像素开始向上连续黑像素的个数。

利用聚类分析分类，每类中的绝大部分碎片同属一行，人工将错误碎片调整，得到各

行碎片，建立优化模型得到复原图，复原图完整度为54.55%,经过23次的人工干预得到最

终的完整复原图。

在文章最后还提出了基于中英文字符不同特点的复原优化模型。

【关键字】碎纸片的拼接、特征因子、灰度矩阵、二值化矩阵、最大类间方差法、最优化、

哈密尔顿路径、聚类分析

I 问题重述

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重

要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎

片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发

碎纸片的自动拼接技术，以提高拼接复原效率。我们需要讨论以下问题：

1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸

片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行

拼接复原。如果复原过程需要人工干预，要求写出干预方式及干预的时间节点。

2. 对于碎纸机既纵切又横切的情形，要求设计碎纸片拼接复原模型和算法，并

针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需

要人工干预，要求写出干预方式及干预的时间节点。

3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印

文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的

碎片数据。要求设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接

复原结果。

Ⅱ 符号说明

II.1 符号说明

问题一

·A; …………………………………………………………… 第个碎片对应的二值化矩阵

……………………………………………………………… A;的首、尾列的向量

·E

……………………………………………………用于存放依次匹配复原的图片的集合

·F ………………………………………………………………………用于存放碎片的集合

)………………………………………………………两点z{,x2间的绝对值距离

·x{(m) ……………………………………………………………………向量x2的第m个元素

●

) ……………………………………………………………………向量x2的第m个元素

·b …………………………………………………… 用于记录碎片相邻顺序的19列行向量

●b(m) ……………………………………………………………………………b的第m列元素

·k ………………………………………………………………………………………计数变量

问题二

· cj

…………………………………用于记录A;空白行位置的列向量，即空白行特征因子

·c;(m) …………………………………………………………………………… c;第m个元素

● ●

·l …………………………………………………………………灰度矩阵A;的向左最小边距

●……………………………………………………………………灰度矩阵A;的向右最小边距

·e ………………………………………………………………………………………边界误差

·α ……………………………………………………………………………像素值的比例因子

●β ……………………………………………………………………………像素值的偏离因子

●

DH …………………………………………………………………………………………阈值

●TH …………………………………………………………………………原图片的文字间距

问题三

·w ……………………………………………………… 每个空白行出现“长比划”的个数

●SH …………………………………………………………………………………………阈值

●A …………………………………………………………………………………碎片二值矩阵

·A( k,j) ……………………………………………………………二值矩阵中第k行，j列元素

●θ1 ……………………………………………从碎片顶端像素开始向下连续白像素的个数

●θ₂ ……………………………………………从碎片底端像素开始向上连续白像素的个数

·m ……………………………………………从碎片顶端像素开始向下连续黑像素的个数

●n₂ ……………………………………………从碎片底端像素开始向上连续黑像素的个数

模型优化

●xi

………………… 残缺字母与第i个字母的模块矩阵中的0元素(黑像素)匹配上的对数

· xi …………………………………………………残缺字母与第p个字母配对的最大比率

I Ⅲ 模型的建立与求解

III. 1问题一

对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接

复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复

原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片

形式及表格形式表达.

最常用的方法就是设定一个全局的阈值，用阈值将图像的数据分成两部分：大于阈

值的像素群和小于阈值的像素群。将大于阈值的像素群设置为白色，小于阈值的像素群

设置为黑色

根据阈值选取的不同，二值化的算法分为固定阈值和自适应阈值，比较常用的二值

化方法有双峰法，P参数法，迭代法和最大类间方差法

最大类间方差法是一种自适应的阈值确定的方法，它是按图像的灰度特性，将图像

分成背景和目标两个部分。背景和目标之间的类间方差越大，说明构成图像的两部分的

差别越大，当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因

此，使类间方差最大的分割意味着错分概率越小。

本题采用的阈值为0.5373的最大类间方差法

在此之后，我们引入绝对值距离来描述匹配程度，具体模型如下。

ⅢI.1.2 问题一模型建立

特征因子的构建

碎片bmpl,bmp2,bmp3,…bmp19对应的二值矩阵分别记为A₁,A₂,…,A1g。特征因子x{,x2

(i=1,2……,19)分别为A;的左、右端列向量，可看做1980维空间内的点，则共有19×2个列向量。

绝对值距离的定义

在A₁(左),A₃(右)(ij=1,2,…,19,且i≠j) 的两点xi,xz间定义绝对值距离：

xí(m)表示向量x2 的第m个元素，x2(m)表示向量x2的第m个元素。

利用两点间距离的大小来判断相A;(左),A;(右)边缘的匹配程度，距离越大代表匹配程

度越低，距离越小代表匹配程度越高。

问题一复原模型以及算法

stepl: 算出19张碎片左端的留白距离，得到距离最大的图片即为原图最左端的碎片，

编号为left, 其二值矩阵为Aleft

step2:建立两个用于存放各图片二值矩阵的集合E,F。E=Aleft,F={A₁,A₂,…,A1g}\

Aeft,建立19列的顺序行向量b,并将其初始化0向量，用于存放重新排列顺序(即复原)后

的碎片对应的二值矩阵标号。b(1)=left.k 为计数变量，表示按照左右相邻顺序已排好k个二

值矩阵(碎纸机图),初始化k=1。

step3:利用最优化的方法为第k张图向右匹配第k+1张图。

得最优解Ass:

剩余48页未读，继续阅读

评论收藏

内容反馈

版权申诉

小码蚁.

粉丝: 2525
资源: 4090

基于matlab的碎纸片的拼接复原内含数据集以及说明书.docx

基于51单片机交通灯课设(内含程序和实物图).docx

基于matlab图像处理的碎纸片的拼接复原内含数据集和源码.docx

本年度培训效果评审总结报告(内含表格、数据分析).docx

单片机控制交通灯(内含程序和实物图).docx

直线二级倒立摆的控制问题的研究和matlab仿真毕业设计说明书.docx

基于 RFMS 指标的大型百货商场会员画像数据挖掘内含设计文档和matlab源码.docx

基于数据分析的高等教育学费标准问题的研究内含设计文档和matlab源码.docx

基于非稳态导热的高温作业专用服装设计内含设计文档和matlab源码.docx

大型百货商场会员画像描述内含设计文档和matlab源码.docx

高等教育学费标准的探讨内含设计文档和matlab源码.docx

基于 0-1 规划的单 RGV 动态调度模型内含设计文档和matlab源码.docx

基于单片机的交通灯控制系统设计说明书.docx

基于多原则比较和蒙特卡洛模拟的 RGV 动态调度模型内含设计文档和matlab源码.docx

基于单片机的光控自动窗帘控制系统设计说明书.docx

基于某矩量法的二维金属体散射(内含matlab程序).docx

基于Andriod环境的地图查询系统设计课程设计说明书.docx

基于优化算法及计算机仿真的交巡警 服务平台设置与调度内含设计文档和matlab源码.docx

基于web的在线考试系统的设计与实现说明书.docx

基于matlab跳频通信基本原理仿真-说明.docx

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

李飞飞自传 我看见的世界 The World I see

农村公交与异构无人机协同配送优化

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

4个亲测好用的ChatGPT4渠道

基于LSTM的财务因子预测选股模型.zip

最新资源

基于优化算法及计算机仿真的交巡警服务平台设置与调度内含设计文档和matlab源码.docx

李飞飞自传我看见的世界 The World I see