这项研究开发,实施和评估一种称为多标签分类K-最近邻居(ML-CKNN)的多标签文本分类算法。 拟议的算法旨在自动识别SEC表格10-K第1A节中报告的具有特定含义的25种类型的风险因素。 ML-CKNN的想法是通过该类别中K个最近邻居计算每个标签的分类相似性得分。 ML-CKNN是为实现从10K中提取风险因素的目标而量身定制的。 所提出的算法可以对74.94%的危险因素和98.75%的标签进行完美分类。 此外,凭经验显示ML-CKNN优于ML-KNN和其他多标签算法。 提取的风险因素可能对会计或财务方面的经验研究有价值。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~