针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进 行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度 计算。最后,使用这5 个相似度作为特征,使用SVM 进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改 善系统的性能。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~