在这项工作中,针对 Khasi 语言的语音数据语料库实现了各种特征提取技术。 本文提供了广泛使用的频谱特征的比较性能分析,如梅尔频率倒谱系数 (MFCC)、感知线性预测 (PLP)、线性预测倒谱系数 (LPCC)、线性预测系数 (LPC) 和线性预测反射系数 (LPREFC) )。 对于每个特征,我们使用了静态、增量和加速度的系数维度来评估卡西语中所说的单词,这是一种在梅加拉亚邦的卡西和贾因蒂亚山区使用的语言。 已经按照标准程序收集了基于记录器的连续语音数据库,并使用波浪冲浪器完成了数据处理。 从分析中可以看出,对于 16 KHz 和 8 KHz 的采样率,MFCC 和 PLP 特征的单词识别精度在任何情况下都优于 LPCC、LPC 和 LPREFC 特征。