没有合适的资源?快使用搜索试试~ 我知道了~
greenkey-asrtoolkit:一组用于处理语音识别数据的有用工具
共84个文件
py:50个
md:5个
stm:5个
需积分: 9 0 下载量 27 浏览量
2021-05-10
05:49:49
上传
评论
收藏 306KB ZIP 举报
温馨提示
GreenKey自动语音识别(ASR)工具包 GreenKey ASRToolkit提供了用于文件转换和ASR语料库组织的工具。 这些旨在简化构建,定制和分析ASR模型的工作流程,对语音识别中的科学家,工程师和其他技术人员很有用。 支持的文件格式 文件格式在asrtoolkit / data_handlers中具有特定于格式的处理程序。 脚本convert_transcript和wer支持 , , , txt ,和格式的成绩单。 也可以使用自定义html格式,尽管对于长期存储,不应将其视为稳定的格式,因为它可能随时更改,恕不另行通知。 convert_transcript usage: convert_transcript [-h] input_file output_file convert a single transcript from one text file format
资源推荐
资源详情
资源评论
收起资源包目录
greenkey-asrtoolkit-master.zip (84个子文件)
greenkey-asrtoolkit-master
.flake8 53B
Dockerfile 704B
.gitignore 232B
README.md 8KB
.github
CONTRIBUTING.md 4KB
ISSUE_TEMPLATE
bug_report.md 673B
feature_request.md 560B
asrtoolkit
extract_excel_spreadsheets.py 2KB
convert_transcript.py 870B
split_corpus.py 2KB
deformatting_utils.py 6KB
data_handlers
greenkey.py 7B
txt.py 951B
vtt.py 1KB
webvtt_common.py 798B
data_handlers_common.py 201B
__init__.py 0B
json.py 4KB
html.py 2KB
srt.py 1KB
stm.py 2KB
prepare_audio_corpora.py 4KB
split_audio_file.py 1KB
clean_formatting.py 8KB
wer.py 5KB
degrade_audio_file.py 728B
alignment
align_utils.py 8KB
aligned_doc.py 9KB
preprocess_txt.py 830B
align.py 6KB
__init__.py 0B
preprocess_gk_json.py 2KB
initialize_logger.py 1KB
__init__.py 1KB
align_json.py 1KB
file_utils
common_file_operations.py 264B
script_input_validation.py 938B
name_cleaners.py 2KB
__init__.py 0B
data_structures
formatting.py 966B
audio_file.py 5KB
exemplar.py 3KB
time_aligned_text.py 5KB
__init__.py 0B
corpus.py 8KB
segment.py 4KB
combine_audio_files.py 4KB
tests
run_tests.sh 59B
test_conversion.py 4KB
small-test-file.stm 158B
test_xlsx_extraction.py 415B
small-test-file.mp3 9KB
test_remove_invalid_lines.py 2KB
docker_test.sh 687B
test_wer.py 960B
test_split_audio_file.py 614B
test_split_corpus.py 2KB
test_alignment.py 624B
test_clean_up.py 6KB
test_initialization.py 1KB
LICENSE 11KB
Pipfile 258B
CODE_OF_CONDUCT.md 3KB
requirements.txt 93B
MANIFEST.in 88B
pyproject.toml 247B
setup.py 3KB
.travis.yml 771B
samples
BillGatesTEDTalk_transcribed.txt 25KB
simple_test.json 2KB
BillGatesTEDTalk.srt 30KB
simple_test.stm 76B
BillGatesTEDTalk.stm 35KB
BillGatesTEDTalk.txt 24KB
invalid.stm 824B
simple_test.txt 22B
BillGatesTEDTalk_intentionally_poor_transcription.txt 24KB
BillGatesTEDTalk.vtt 35KB
BillGatesTEDTalk.json 860KB
FinancialStatementFY18Q4.xlsx 69KB
BillGatesTEDTalk_transcribed.stm 36KB
BillGatesTEDTalk.html 41KB
NOTICE 171B
.pylintrc 11KB
共 84 条
- 1
资源评论
嘿嗨呵呵
- 粉丝: 33
- 资源: 4496
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- mc.as
- 618家具社群团购清单.xlsx
- Javascript的鼠标手势
- hdmi in视频采集,输出到hdmi out, 支持HDMI指令控制,支持TFTP远程下载图片
- 批量word文件内容替换工具1.0 (批量实现多个 Word 文档文件文字替换利器).exe
- Cartoon GUI Pack 1.2.zip
- 我分享个魔兽内存修改器
- Python毕业设计基于Django的网易云数据分析可视化大屏系统的设计与实现+使用说明+全部资料(优秀项目).zip
- mp3 idv2,idv1,frame分析工具
- 鹈鹕优化算法POA MATLAB源码, 应用案例为函数极值求解以及优化svm进行分类,代码注释详细,可结合自身需求进行应用
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功