工作研究
—4—
基于 matlab 的热成像图片数字识别分析系统
王书来
(中海石油(中国)有限公司天津分公司,天津 300467)
摘 要:随着海上平台电力组网的发展,电压等级的升高和设备负荷的增大,电力系统对各类电气设备运行可靠性的要求也越来越
高,运行温度是确保电气设备健康稳定运行的参数之一。海上平台电气设备温度检测多采用 FULUK 型红外热成像仪,该
设备具有不接触、实时、快速、直观、且方便进行计算机分析等优点,通过 MATLAB 软件对热成像图片数据识别,提取,
分析,最终自动生成分析报告,在预防电气设备隐患发生,提高设备运行可靠性,保证海上油田生产的稳定运行方面起到
很好的效果,具有一定的借鉴意义。
关键词:图像处理;数字识别;数据分析
前言
石油开采行业从原油开采、脱水处理到达标原油输出,各个
环节都具有较大火灾危险性,因此有必要采取有效的组织措施和
技术措施来防止电气设备因发热而引发的火灾。红外热成像仪是
海上平台使用较为广泛的一种温度检测仪器,该仪器采集设备表
面发出的红外辐射信息,通过内部处理单元作进一步分析,获取
到设备各点温度,最终以图像形式输出。它具有不接触、实时、
快速、直观、方便进行计算机分析等优点,为诊断电气设备运行
状态,判断电气设备故障具体部位提供了全面而准确的温度场分
布图像,帮助电气人员及时发现隐患并将其消灭在萌芽阶段。
1 技术简介
1.1 图形预处理
图 1 某变压器设备热成像采集图像
如图一所示,为该平台某变压器热成像采集图像,以该图为
例,需要采集温度数据为最高点温度 109.5℃,最低点温度 45.3℃,
中心点温度 64.1 度。由于数字所在区域背景存在的差异可能造成
字形畸变,同时图像数据输入 matlab 过程中也会产生噪声,因此
为了提高数据识别的可靠性和准确性,在进行数据识别过程前,
需要对热成像采集图像进行预处理。
1.1.1 二值化
Matlab 图像处理工具箱支持索引图像、灰度图像、二进制图
像和 RGB 图像四种基本图像类型,通过 imread 直接读入的 jpg 格
式图像为 RGB 图像,以三维数组的形式存储,每个维度数值大小
依此对应红(Red)、绿(Green)、蓝(Blue)三种颜色的强度。将图像的
每个像素点处理为二值(0,1)图像的过程成为二值化。二值化
图像具有占用空间小,操作速度快等优点,方便了图像的后续处
理。
1.1.2 归一化
在数字识别过程中,无论是手写字符,还是印刷体字符,由
于采集数据在大小和形状方面存在比较大的差异,所以,将图像
进行归一化处理,是图像预处理中的重要一环。同时,手写数字
图的识别和数字特征值的提取都需要在归一化的基础上进行,因
此,无论采用哪种处理进行数字识别,都必须先进行归一化处理。
归一化分为位置归一化和大小归一化,位置归一化又可分为中心
归一化和外框归一化两种,大小归一化同样可以分为两种,分别
是线性归一化和非线性归一化。
1.2 数字识别
常用的数据识别算法有模板匹配法,统计决策法,句法结构
法,模糊判别法,逻辑推理法,神经网络法。由于我们采集的数
据属于印刷体数字,相对手写体数字而言识别率较高,但是,热
成像采集图片数据量大,以渤海某平台为例,单月热成像采集图
片约 1300 张,每张包含单个数字 12 个,需要识别统计的数据多
达 15,600 个。在保证正确率的同时,数据识别耗时的长短也需要
考虑。为此,我们采用了运算量较小,识别度较高的逻辑推理法。
1.2.1 样本数据采集
以历年来热成像图像中的数字为数据源,通过样本数据采集
单元提取“0”到“9”每个字符 100 个,这样一共采集到 1000 个
样本数据。
1.2.2 识别算法
1.2.2.1 2×2 网格特征识别
预处理后的单个字符图片为 25×13 像素的图片,我们把该图
片切分为 4 个 12×6 像素的区块,将采集到的样本数据做同样区
块划分后统一对比分析,计算出每个区块中特征行 z 的白色像素个
数 b
m,n
。
表 1 各区块特征行白色色块数量列表
数字
b
m,n
数字区块
0
1
2
3
4
5
6
7
8
9
区块(1,1) 1
2
0
0
1
2
1
0
1
2
区块(1,2) 1
1
1
2
2
0
0
2
1
2
区块(2,1) 1
1
2
0
0
0
1
2
2
0
区块(2,2) 2
0
0
1
2
2
2
0
1
2
通过对上表分析,特征行是否存在白色色块可以作为数据识
别的重要特征之一,即判断 b
m,n
>0 是否为真,为真则 c
m,n
=1,反之
则 c
m,n
=0。对各区块判断结果进行二进制编码。
表 2 各区块是否存在白色色块列表
数字
c
m,n
数字区块
0
1
2
3
4
5
6
7
8
9
区块(1,1)
1 1
0
0 1 1
1 0
1 1
区块(1,2)
1 0
1
1 1 0
0 1
1 1
区块(2,1)
1 1
1
0 0 0
1 1
1 0
区块(2,2)
1 0
0
1 1 1
1 0
1 1
d
n
15
5
6
10
11
9
13
6
15
11
由表 2 看出,“0”和“8”, “2”和“7”, “4”和“9”特
征值d
n
相同,需要进行进一步特征值甄别。
1.2.2.2 “0”和“8”特征识别
对特征值d
n
=15 的数字进行再次识别,通过比对,“0”和“8”
最大的区别点在于中心区域是否有白色像素存在。因此,计算出
(下转第 6 页)