没有合适的资源?快使用搜索试试~ 我知道了~
g2pM:基于新的开放基准数据集的汉语普通话的神经音素到音素转换包
共17个文件
pkl:4个
sent:3个
lb:3个
需积分: 48 2 下载量 105 浏览量
2021-04-14
02:28:04
上传
评论
收藏 6.05MB ZIP 举报
温馨提示
g2pM 这是我们论文 ( Interspeech 2020 )的官方资料库。 安装 pip install g2pM CPP数据集 在数据文件夹中,有[train / dev / test] .sent文件和[train / dev / test] .lb文件。 在* .sent文件中,每行对应一个句子,并且在复音字符的左侧和右侧添加特殊符号(U + 2581)。 对应字符的发音与* .lb文件位于同一行。 对于每个句子,可以有多个和弦字符,但是我们随机选择仅一个和弦字符进行注释。 要求 python> = 3.6 麻木 用法 如果要删除表示音调的所有数字,请设置tone = False。 默认设置为tone = True。 如果要拆分所有非中文字符(例如,数字),请设置char_split = True。 默认设置为char_split = False。 >>> from g2p
资源推荐
资源详情
资源评论
收起资源包目录
g2pM-master.zip (17个子文件)
g2pM-master
MANIFEST.in 111B
data
train.sent 7.41MB
train.lb 394KB
test.sent 987KB
dev.sent 946KB
test.lb 51KB
dev.lb 49KB
g2pM
class2idx.pkl 14KB
char2idx.pkl 83KB
g2pM.py 9KB
np_ckpt.pkl 1.53MB
__init__.py 62B
digest_cedict.pkl 370KB
LICENSE 11KB
setup.py 943B
.gitignore 2KB
README.md 3KB
共 17 条
- 1
资源评论
少女壮士
- 粉丝: 29
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功