基于书写规则的书法字笔画及笔顺提取基于书写规则的书法字笔画及笔顺提取
提出了一种针对篆书和隶书等多类别书法字图像笔画及笔顺信息的提取算法。算法通过使用书法字骨架图与轮
廓图相结合的方式,使用针对交叉处轮廓点角度聚类及该点与交叉中心欧氏距离相结合的聚类准则,完成交叉
处笔画的信息补全、处理,并根据书写规则提取书法字的笔顺信息。最后,针对楷体、隶书、篆书三类书法字
图像做笔画以及笔顺信息的提取,实验结果表明本文所提出的方法对多类别书法字图像笔画提取取得了较好的
效果。
摘摘 要要: 提出了一种针对篆书和隶书等多类别
关键词 关键词: 书法字;笔画提取;书写规则;书法笔顺
0 引言引言
中华民族五千年文化中有大量书法作品,这些书法作品被扫描成页面图像,能够有利于书法作品的保护以及便于书法作品
的流传、鉴赏,但是书法页面图像却无法表现汉字书写的过程,丢失了笔顺信息。
书法字笔画、笔顺信息除了有益于书法教学之外,在书法书写过程重现、书法风格自动识别等领域中也是最为重要的信
息。
本文提出的方法利用书法单字骨架,结合轮廓图提取完整笔画,并依据书写规则,确定笔画书写顺序。
1 相关工作相关工作
1.1 笔画提取笔画提取
目前,有很多的方法来完成笔画提取的工作。在笔画提取过程中主要需要解决两个关键问题:(1)独立笔画的提取;
(2)交叉笔画在交叉段的处理。
目前大多数的笔画提取方法是细化处理:将输入的汉字图片处理为骨架图。对整个汉字骨架进行跟踪,初步提取笔画。此
时,无交叉笔画已完成提取,但分叉点连接着多个不完整的笔画段。此后通过一定的合并、拆分规则,最终获得准确笔画。这
种处理方式能够将汉字的笔画方向信息完整地保留下来,同时因为整个骨架图为单像素宽度,降低了后续笔画提取的计算复杂
度。这种方式也存在着较为明显的缺点:(1)失去了笔画的宽度信息;(2)在细化过程中,会引入一定的形变,为后续笔
画的正确提取造成了一定的难度[1-3]。
另一部分笔画提取方法使用的是轮廓图或线邻接图(LAG)。提取轮廓特征点,计算各特征点的曲率,寻找出曲率最大的
点,确定为笔画拐点。由于在笔画交叉处,必然存在拐点或角点,因此确定拐点或角点的位置能够进一步确定笔画的走向,完
成交叉段不同笔画的分割、提取[1-3]。
参考文献[4]提出了基于Delaunay三角剖分的三角网格表征与点到边界方向距离PBOD曲线相结合的笔画提取方法。相较
于传统的基于汉字细化和LGA等方法,该方法从汉字的基础特征着手,提取效果较好。
上述方法只是针对于某一单一风格的书法字笔画提取,或者印刷体汉字提取,没有针对多类别的书法字的笔画提取进行验
证。
1.2 笔顺信息提取笔顺信息提取
汉字是一种象形文字,其典型的书写规则:先左后右,先上后下。本文利用该规则,结合已有的笔画信息,对笔画进行排
序,获得笔顺信息。
2 系统框架系统框架
算法的流程图如图1所示。
3 骨架笔画提取骨架笔画提取
3.1 汉字骨架汉字骨架