大量的不规范表结构信息是当前Web信息提取所必须解决的问题。在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范表结构Web信息的算法。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~