1.本文提出一种更简单实用的知识驱动的图像挖掘框架模型,该模型的特
点是在图像挖掘产生的回溯过程中可利用前面所有步骤或者后面相邻步骤己经
分析发现的模式或知识。并且用户可以通过图像样本训练和交互式学习与整个框
架模型产生互动,随时对现有领域知识进行补充和学习。
2.本文提出了一种采用特征组合挖掘文本图像的方法,适用于多种文本图
像,如场景文本图像、标题文本图像和文档图像。自然的文本场景图像含有重要
的语义信息,如街道名称、机构、商店、路标和交通信号等。新闻视频中的标题
文本通常解释了所发生事件的地点、时间和人物。体育视频的副标题会注解比分
和选手信息。而文档图像则兼具图像与文本,但文本与图像可分离。区分不同类
型的图像具有重要的意义,可在各种实际应用中采用最相关的图像,如为盲人提
供可辨认街道标志牌的“智能眼镜”,在新闻视频中注解报道内容以及自动追踪
车辆移动,也可应用与机器视觉相关的其他领域。