深度演讲者:端到端神经演讲者嵌入系统。
深度演讲者的非官方Keras实现| 。
样品结果
对模型进行了干净语音数据的训练。 请记住,在嘈杂的数据上性能会降低。
型号名称
测试数据集
数字扬声器
F
TPR
行政协调会
能源效率
训练记录
下载型号
ResCNN Softmax训练有素
全部(*)
2484
0.789
0.733
0.996
0.043
ResCNN Softmax + Triplet训练有素
全部(*)
2484
0.843
0.825
0.997
0.025
(*)全部包括:dev-clean,dev-other,test-clean,test-