论文研究-AMR-WB固定码本快速搜索新方法.pdf

所需积分/C币:21 2019-09-08 01:37:31 581KB .PDF
15
收藏 收藏
举报

在AMR-WB中,固定码本搜索是影响性能和复杂度的关键模块,约占总复杂度的40%。为了降低计算量,提出了一种码字分裂、子码字脉冲取代的高效码本搜索算法。该算法包括四步:一个初始码字分裂为两个或更多的子码字;每个子码字通过最不重要脉冲取代法进行更新;更新后的子码字合成一个候选的码字;比较初始码字和候选码字,选择优者作为最后的码字。实验表明,与传统方法相比,编码时间减小约16%。
2012,48(36) Computer Engineering and Applications计算机工程与应用 固定码本搜索的目标是找出最佳码字及其增 (1)在各轨道中,16个脉冲根据命中函数b(m)进 益,使得加权输入语音与合成语音之间的均方误差行排序,每轨道选出最大的两个脉冲构成初始码字 最小,其搜索准则是使得式(3)的gk最大。DFIS算 Codeword0,计算相应的Qo。假设各轨道中脉冲排 法的细节可参考文献[1],一次搜索一对脉冲,并且这列如表2 对脉冲放在连续的轨道上,搜索树共4层,总的搜 表2各轨道中脉冲排列 索次数为:4×(4×16+8×16+8×16)=1280。 轨道 脉冲位置 T4,0,32,8,16,36,12,44,28,24,20,48,52,56,60,40 固定码本搜索新方法 TI 9,5,41,1,29,33,61,13,17,21,45,37,25,53,57,49 3.1最不重要脉冲取代法 2,6,10,42,22,30,58,26,14,46,38,62,54,50,18,34 T 3,7,51,23,11,27,39,55,47,43,63,19,59,31,15,35 最不重要脉冲取代法的基本思想是:对于给定 的初始码字,计算去除其中一个脉冲之后码字对应 据此,初始码字 Codewo0中非零脉冲位置分布 的Qk,Qk值最大,说明去除的那个脉冲即为最不重为(4,0,9,5,2,6,3,7)。 要脉冲,然后从该脉冲所在的轨道中选出一·个新脉 (2) Codeword0中8个非零脉冲按位置索引从小 冲来取代它,经多次迭代所得码字更接近于最佳码到大排序,即(0,2,3,45,6,7,9),然后分裂为两个 字,当gk不再发生变化时,则停止整个取代过程。 子码字: Codeword和 Codeword2, Codeword包 含偶索引脉冲, Codeword2包含奇索引脉冲。即有 32码字分裂子码字脉冲取代法 最不重要脉冲取代法的复杂度与参数Q4的计 Scodewordl=(0, 3, 5, 7), Scodeword2=(2, 4, 6, 9) (3)子码字 Codeword l和 Codeword2采用最不 算直接相关。因此简化Q的计算是降低固定码本重要脉冲取代法进行优化。具体做法是每个子码字 搜索复杂度的关键。而码本搜索的运算量与码字中中最不重要的脉冲被同轨道中的某一脉冲取代。不 非零脉冲数呈近似指数关系,基于此, CSSPR先将候妨假设 Scodewor1和 Codeword?中最不重要的脉冲 选码字分裂为两个或更多的子码字,每个子码字包7和2分别被同轨道中的27和46所取代,优化后的两 含一定数量的非零脉冲,而各子码子用最不重要脉个子码字记为 OScodeword1-(0,3,5,27)和 OScoda 冲取代法进行优化更新。设分裂前的码字中非零脉wo2-(46,4,6,9)。 冲数为P,若将其分裂为t个子码字,每个子码字包 (4) COdeword1和 OScodeword2组合为候选码 含Sn=P个非零脉冲数,t个子码字采用最不重要字,记为 Codeword-(0,4,5,6,7,9,27,46),其对应 脉冲取代法进行优化,优化后的子码字组合后作为的Q记为9A,若QA1>Q,则 Codeword重新分 个侯选码字,这一过程重复m次,最后从m个候选裂,重复以上过程。否则初始码字作为最终的码字。 码字中选择最优码字。¢SSPR算法流程图如图1所 (5)步骤(1)~(4)重复m次,得到m个侯选码 示,取t=2。 字,选择最佳的作为最终码字。 「初始码字Cm夏O 3.3 CSSPR性能与计算量分析 码字分裂 在 AMR-WB中,语音质量与Qk有关,Qk越大 意味着音质越好。假设初始码宇分裂成2个子码字 Codeword COdeword LIPRS 即t=2,相应的参数记为g,对照式(3),子码字的 CODeword 1 OSCodeword2 相应参数记为R,E,RA,EAD,R2和E2,根 合成 Codeword及O 据式(3)可以推导出以下关系式: R1)2+(R R Q>Qo→输出最佳码字 ≤g 更新 Codewor0 RkD+(R R R 图1 CSSPR算法流程图 Ek+Ek E E 以 AMR-WB中12.65kbs模式为例,此时P=8 (8) Sn=4, CSSPR算法过程如下 klp 唐骏,袁江南: AMR-WB固定码本快速搜索新方法 2012,48(36) 从式(8)可以看出,码字分裂会导致音质下降, 表4DFTS和HQ- CSSPR编码时长比较 因为子码字搜索是一种局部寻优算法,而且,音质会比特率DFs HQ-SCPRS 随着分裂的子码字数量增加而进一步下降。 kb m=1m=2n=3m=4m=5 6.60 在CSPR算法中,子码字每搜索一个最不重要 8.85 66 脉冲,需要计算S×(S2-1次Qk,另外,每取代一个 12.65 最不重要脉冲时,需要计算15次Q,假设 CSSPR迭 76 8」 代m次,每一个非零脉冲需要计算gk的次数为 18.25 94 73 97111128 151×P 19. 10s11011412 TC= 23.05 10s130154175 23.85 120144164189 P×S×m+ XP×m P×m (9) 平均时长 92101111 S 时长对比(%) 16.1 5.75.716.1276 对于选定的比特率模式,非零脉冲数P是确定 的,当满足如下条件时,C将取得最小值: 长小于DFTS,但在高比特率模式下(1985,2305, P×S 15×P×m 23.85且m=2以及23.85且m=1),编码时间反而更长 (10) 原因是这些比特率模式下,DFTS为了将码本搜索运 根据式(10),可以定量评估 CSSPR的计算复杂度。算量控制在可接受的范围内,对非零脉冲的位置作了 例如对丁12.65kb模式,设=2,即S=4时,且令限制。对于其他比特率模式,当m3时,CSPR的编 m=2,则每一个非零脉冲需要计算Q次数为108 码时问减小10%以上。 ,2了码字脉冲数的影响 4实验结果 在3.3节中已经证明, CSSPR的计算量当S 中41测试方法 √5≈4时达到最小,同时指出,码字分裂的次数越4 为了评佔 CSSPR的性能,采用PESQ测评方法,多,音质下降越严重。本节实验的目的是为了测试 各种码本搜索算法的效率通过 AMR-WB编码时长来当S=4(最优值)时CSPR的性能,称为低复杂度 比较。 CSSPR,记为LC- CSSPR。以下实验取m=2。 测试序列选用ITU-T3GPP提供的标准文件 HQ-CSSPR和LC- CSSPR的性能比较见表5和 T10inp。当码宇分裂为两个子码字时,即t=2,称之表6。与DFTS相比,LC- SCPRS的平均编码时间减 为高音质模式HQ- CSSPR,PESQ测试及编码时长如小了17.2%,但音质下降严重,为5.3%。通过比较各 表3和表4所示。可以看出,在 HQ-CSSPR模式下,比特率模式下的结果,可以发现, LC-CSSPR在高比 音质随迭代次数m的增加而提高。 特率模式下比低比特率模式下的编码时间缩短更明 表3DFTS和 HQ-CSSPR的PESQ测试MOS值 显,同时音质损失更严重。囚为高比特率模式下子 比特率 H O-CSSPR 码字的数量更多。 DFTS /(kb·s-1) m=1m=2=3 6.60 3.209305430543.0543.0543.054 表5DTS和SPRS编码时长比较 3.4873.3753.3853.4143.4133.413 比特率(kb·s-) DFTS HQ-SCPRS LC-SCPRS OP- SCPRS 12.65 3.7473.5423.6213.6253.5963.614 3.7913.5923.6563.653.673.665 8.85 73 585 3.7973.6233.6553.7023.7093.718 18.25 3.8663.673.7293.7533.7893.776 14.25 71 198538943.6763.7263.78837953.786 15.85 76 76 23.05 3.90736923.7573.8143.8223.837 82 3.9143.6923.7583.8143.8223.837 19.85 104 平均MOS3.7353.5463.5933.6243.6303.633 107 质对比/(%) 5.1-3.8-3.0-2.8-2.7 23.85 120 93 93 平均时长 表4表明,当m<3时,HQ- CSSPR的平均编码时时长对比/%) 5.7 -17.2 -16.1 18 2012,48(36) Computer Engineering and Applications计算机工程与应用 表6DFTS和 CSSPR的PESQ测试MOS值 transcoding[s].2000 比特率(kb·s-) DFTS HQ-SCPRS LC-SCPRS OP- SCPRS [2] Bessette B, Salami R, Lefebvre R, et al. The adaptive mul- 3.2093.054 3.054 3.054 tirate wideband speech codec(AMR-WB)[J].IEEE Trans 8.85 3.4873.385 3.385 3.385 actions on Speech and Audio Processing, 2002, 10(8): 1265 3.747 3.621 3.621 3.621 620-636 14.25 3.791 3.656 3.566 3.656 [3] Salami R, Laflamme C, Adoul J P, et al. Design and de 1585 3.797 3.655 3.608 18.25 3.866 3.626 3.729 scription of CS-ACELP: a toll quality 8 kb/s speech cod 3.894 3.726 3.654 3.654 er[J]IEEE Transactions on Speech and Audio Process 23.05 3.907 3.757 3.661 ing,1998,6(2):116-130 23.85 3.914 3.661 [4]赵欢,范锦秀,张波涛.一种新型快速的固定码本搜索方 平均MOS3.7353.593 3.537 3.564 去山计算机工程与应用,2010,46(15):135-137 音质对比/(%) 5 Lee E D, Ahn J M.Efficient fixed codebook search method 为了保证低比特率模式下的音质,同时控制高比 for ACELP speech codecs[C]/Advances in Hybrid Infor- 特率模式下的运算复杂度,提出一种优化的 CSSPR, mation Technology, 2007, 4413: 178-187 记为OP- CSSPR。在 OP-CSSPR中,三种高比特率模 Lee Eung-Don, Kim Do- Young Method for searching fixed 式下子码字的结构和 LC-CSSPR相同,而其他比特率 codebook based upon global pulse replacement: United 模式下和 HQ-CSSPR相同。 States,US7,739,108B2[P].2010-06-15 OP-CSSPR的性能见表5和表6的最后一列。平 [7 Chen F K, Chen G M, Su B K, et al. Unified pulse-replace ment search algorithms for algebra codebooks of speech 均编码时间减小了16.1%,与LC- CSSPR接近。尽管 coders[J].Signal Processing, IET, 2010, 4(6): 658-665 音质下降率从3.8%增至4.5%,但主观测试表明,音质 [8 Falahati A, sole MA ed fast ACeLp 与 HQ-CSSPR难以区分。因此, OP-CSSPR在运算复 book search[c]//14th Asia-Pacific Conference on Com 中杂度和音质之间做了很好的折中。 munication, Tokyo, 2008: 1-5 9 Falahati A, Soleimani M, Vakili V T Dynamic tree pruning 结论 method for fast ACELP search[C]//3rd International Con 针对 WMR-WB固定码本搜索复杂度高的问题, Terence on In formation and Communication Technologies 提出了一种新的快速搜索方法 CSSPR,在该方法中 From Theory to Applications, Damascus, 2008: 1-6 初始码字分裂成两个或更多子码字,并用 LIPRS算法10ti, nen G. Study on fast fixed-codebook search algo- 寻找最佳的子码字。子码字组合得到候选码字,最 rithm in G 729 speech coding[C]//Second International 后选择最佳码字。通过比较高音质模式 HQ-SCPRS Workshop on Computer Science and Engincering, 2009 和低复杂度模式LC- SCPRS的性能,进一步提出了 279-282 种优化的 CSSPR算法 OP-SCPRS, OP-SCPRS在算法[1 Leee d,LeMS, Kim D Y Global pulse replacement method for fixed codebook search of ACELP speech 复杂度和音质之间做了很好的折中。实验表明,与 codec[C]//Proceedings of the 2nd IASTED International DFTS相比, OP-SCPRS编码时间减小了16%,而首质 Conference. 2003:372-375 约有3%~5%的下降,而且,该算法无需额外的存储 [12] Lee E D, Yun S H, Lee S I, et al. Iteration-free pulse 开销,非常适合嵌入式的应用。 replacement method for algebraic codebook search[J] Elec Letters,2007,43(1):59-60 参考文献: [13]范锦秀AMR-WB语音编码算法的优化及实现[D]长沙: [1 3GPP 3G TS26 190 Adaptive multi-rate wideband speech 湖南大学,2009

...展开详情
试读 5P 论文研究-AMR-WB固定码本快速搜索新方法.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-AMR-WB固定码本快速搜索新方法.pdf 21积分/C币 立即下载
1/5
论文研究-AMR-WB固定码本快速搜索新方法.pdf第1页

试读结束, 可继续读1页

21积分/C币 立即下载