设计了一种基于统计的多层次分类算法 :在一个树状的层次分类体系中,对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的最底层子类 。每一层中使用支持向量机作为分类模型,并使用类别均衡的方法解决数据稀疏的问题,在经过大规模网页语料训练后取得了很好的分类效果 。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~