针对汉语语音文档检索中最优识别单元和检索单元替代的问题,提出一种基于子词(特定位置的后格,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索。 ,所提出的方法在利用丰富的语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显发生了目前普遍使用的识别单元和检索单元替换词的PSPL索引方法的问题。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~