论文研究-基于互信息的维吾尔文自适应组词算法.pdf

所需积分/C币:6 2019-07-22 22:11:48 896KB .PDF
收藏 收藏
举报

传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段, 因此在维吾尔语文本分析及文本处理过程中导致许多问题, 严重影响文本处理效率。提出了一种维吾尔文组词的全新概念, 用互信息作为相邻单词间关联程度的度量, 实现了基于分段式策略和增量式策略的两种自适应组词算法, 并与传统的分词方法得到的词汇表进行对比分析。实验结果表明, 组词算法能够非常有效地提取文本中的语义词, 两种算法在大规模文本集上的组词准确率分别达到了8431%和8824%。

...展开详情
试读 4P 论文研究-基于互信息的维吾尔文自适应组词算法.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    • 至尊王者

      成功上传501个资源即可获取
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于互信息的维吾尔文自适应组词算法.pdf 6积分/C币 立即下载
    1/4
    论文研究-基于互信息的维吾尔文自适应组词算法.pdf第1页
    论文研究-基于互信息的维吾尔文自适应组词算法.pdf第2页

    试读已结束,剩余2页未读...

    6积分/C币 立即下载 >