使用Python和百度语音识别生成视频字幕的实现_免费音频转srtapi接口资源-CSDN文库

40 浏览量 2020-09-17 14:28:35 上传评论 2 收藏 100KB PDF 举报

资源详情

资源评论

使用使用Python和百度语音识别生成视频字幕的实现和百度语音识别生成视频字幕的实现

主要介绍了使用Python和百度语音识别生成视频字幕，文中通过示例代码介绍的非常详细，对大家的学习或者工作

具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

从视频中提取音频从视频中提取音频

安装 moviepy

pip install moviepy

相关代码：

audio_file = work_path + '\out.wav'

video = VideoFileClip(video_file)

video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1'])

根据静音对音频分段根据静音对音频分段

使用音频库 pydub，安装：

pip install pydub

第一种方法：

# 这里silence_thresh是认定小于-70dBFS以下的为silence，发现小于 sound.dBFS * 1.3 部分超过 700毫秒，就进行拆分。这样子分割成一段一段的。

sounds = split_on_silence(sound, min_silence_len = 500, silence_thresh= sound.dBFS * 1.3)

sec = 0

for i in range(len(sounds)):

s = len(sounds[i])

sec += s

print('split duration is ', sec)

print('dBFS: {0}, max_dBFS: {1}, duration: {2}, split: {3}'.format(round(sound.dBFS,2),round(sound.max_dBFS,2),sound.duration_seconds,len(sounds)))

感觉分割的时间不对，不好定位，我们换一种方法：

# 通过搜索静音的方法将音频分段

# 参考：https://wqian.net/blog/2018/1128-python-pydub-split-mp3-index.html

timestamp_list = detect_nonsilent(sound,500,sound.dBFS*1.3,1)

for i in range(len(timestamp_list)):

d = timestamp_list[i][1] - timestamp_list[i][0]

print("Section is :", timestamp_list[i], "duration is:", d)

print('dBFS: {0}, max_dBFS: {1}, duration: {2}, split: {3}'.format(round(sound.dBFS,2),round(sound.max_dBFS,2),sound.duration_seconds,len(timestamp_list)))

输出结果如下：

感觉这样好处理一些

使用百度语音识别使用百度语音识别

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论收藏

内容反馈

使用Python和百度语音识别生成视频字幕的实现

评论0

最新资源

使用Python和百度语音识别生成视频字幕的实现

评论0

最新资源

相关推荐

python进行视频字幕视频和合成

Python-生成视频字幕的pytorch代码

利用Python提取视频中的字幕（文字识别）

Python-srtsync基于视频中语音活动的字幕自动同步器

电影字幕提取方式

从头开始在Python中开发深度学习字幕生成模型

image-captioning:图像字幕是一个项目，该项目实现了基于分布式表示的图像扩展查询扩展方法

python 声音识别，转换为文字。

Python实现原视频转字符视频video2str，

基于腾讯云AI录音文件识别让无字幕视频自动生成字幕python源码+项目使用文档.zip

Python阿里云音频转字幕源代码，使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写出 srt 字幕

人工智能_语音识别_视频语音识别_这是一个可以识别视频语音自动生成字幕SRT文件的开源 Windows-GUI 软件工具

video-srt-windows：这是一个可以识别视频语音自动生成字幕SRT文件的开源Windows-GUI软件工具

使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写出 srt 字幕.zip

使用python自动识别视频摘要

基于语音识别接口智能语音识别和字幕推荐系统-深度学习算法应用（含全部工程源码）+测试数据集

Python设计的多功能视频播放器.zip

GenVIdeo:快速高效的生成抖音，快手，火山，西瓜视频；批量制作新闻资讯，笑话等短视频；视频风格转移；动态排名视频；视频批量上传，批量发布

NLP资源库.zip

几乎最全的中文NLP资源库.zip

voice_to_text.zip

期限项目：多说话者识别

github_HaujetZhao_ali-audio-text-sync

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

大麦网抢票脚本【Python脚本】

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar