分析了与类别信息有关的cHI统计特征选取方法和与类别无关的文档频率特征选取方法,在此基础上提出文档频率与CHl统计相结合的特征提取方法。以选取分类能力强的词项特征,从而提高网页分类效果。以该联合特征提取方法为基础构建的网页分类系统,在参加sEwM2007分类评测的8个代表队中,取得Macro-F1值排名第3的成绩。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~