塔里斯基于TensorFlow 2的基于变压器的在线语音识别系统关于 Taris是[1]中描述的一种在线语音识别方法。该系统通过学习计算其中的口头单词数来动态地分割口头句子。解码以段的动态窗口为条件，而不是像原始序列到序列体系结构中的整个发音那样。该存储库还维护了当前使用Transformer堆栈而不是原始循环网络[4]实施的视听对齐和融合策略AV Align [2,3]。概述为了进行在线解码，Taris学会计算口头句子中的单词数。正如我们在[1]中所展示的，该任务有助于将语音输入划分为可以Swift解码的段。但是，为了匹配脱机系统的准确性，需要更长的上下文。下图说明了一个示例，其中解码器使用两个回溯段和超前段来调节输出模态中给定单词内的所有字符。一旦中的所有字符decision处理和系统预测空格令牌，通过一个多段的注意分配的进步，并且在计算音频上下文向量以用于

资源推荐

资源详情

资源评论

收起资源包目录

Taris-master.zip （37个子文件）

Taris-master

.gitignore 86B

LICENSE 16KB

extract_faces.py 2KB

.github

FUNDING.yml 69B

README.md 4KB

optuna_search.py 2KB

avsr

noise_data

street_noise_downtown.wav 2.57MB

notice 196B

cafeteria_babble.wav 2.45MB

experiment.py 3KB

video.py 5KB

dataset_writer.py 14KB

__init__.py 86B

utils.py 6KB

awgn.py 3KB

metrics.py 3KB

avsr.py 17KB

loss.py 2KB

io_utils.py 12KB

audio.py 1KB

misc

labels_boundaries_lrs2 2.81MB

phoneme_list 99B

viseme_list 24B

labels_boundaries_libri_testclean 357KB

character_list 56B

optimiser.py 3KB

visualise

segmentation.py 3KB

transformer

utils.py 8KB

attention_layer.py 11KB

embedding_layer.py 3KB

beam_search.py 28KB

model.py 33KB

write_records.py 2KB

run_audiovisual.py 2KB

run_audio.py 2KB

img

taris.png 19KB

taris2.png 19KB

共 37 条

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

weixin_42166626

粉丝: 20
资源: 4530

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

Taris:基于TensorFlow 2的基于变压器的在线语音识别系统

TARIS-开源

【代码分享】手把手教你：基于TensorFlow的语音识别系统

基于Python+TensorFlow深度学习的噪声抑制与语音识别系统源码（python毕业设计）.zip

taris个人设置：taris个人设置

tarisapi:用于 Taris 的 Node.js RESTful api

接线端子[手册].pdf

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

python3.12版本轮子文件dlib-19.24.2-cp312-cp312-win-amd64.whl

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

大麦网抢票脚本【Python脚本】

Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档

YOLOv8-火焰识别（火焰数据集+代码+GUI界面+内置训练好的模型文件）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

Python学习笔记(干货) 中文PDF完整版.pdf

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

人体姿态检测

抢购haiwei.rar

Python 八股文.pdf

第十五届蓝桥杯大赛软件赛省赛-PythonA组题目

计算机毕业设计源码：基于python旅游推荐系统+爬虫+分析可视化 +django框架

shape_predictor_68_face_landmarks.zip

计算机毕业设计：基于python微博舆情分析可视化系统+爬虫+情感分析+Flask框架 项目源码

这是一款用于破解wifi密码的软件

计算机二级python真题题库（题目+答案）电子版笔记2

爱心代码 李峋同款爱心等免费下载 exe、py、html格式

大麦抢票+源代码+辅助工具+详细文档教程

最新资源

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料

计算机毕业设计：基于python微博舆情分析可视化系统+爬虫+情感分析+Flask框架项目源码

爱心代码李峋同款爱心等免费下载 exe、py、html格式