python调用百度语音识别实现大音频文件语音识别功能_语音识别如何调用Python语言的实现包资源-CSDN文库

26 浏览量 2021-01-21 17:43:15 上传评论 1 收藏 41KB PDF 举报

资源详情

资源评论

资源推荐

python调用百度语音识别实现大音频文件语音识别功能调用百度语音识别实现大音频文件语音识别功能

本文为大家分享了python实现大音频文件语音识别功能的具体代码，供大家参考，具体内容如下

实现思路：先用ffmpeg将其他非wav格式的音频转换为wav格式，并转换音频的声道（百度支持声道为1），采样率（值为

8000），格式转换完成后，再用ffmpeg将音频切成百度。

支持的时长（30秒和60秒2种，本程序用的是30秒）。

# coding: utf-8

import json

import time

import base64

from inc import rtysdb

import urllib2

import requests

import os

import uuid

from inc import db_config

class BaiduRest:

def __init__(self, cu_id, api_key, api_secert):

self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"

self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"

self.upvoice_url = 'http://vop.baidu.com/server_api'

self.cu_id = cu_id

self.get_token(api_key, api_secert)

return

def get_token(self, api_key, api_secert):

token_url = self.token_url % (api_key, api_secert)

r_str = urllib2.urlopen(token_url).read()

token_data = json.loads(r_str)

self.token_str = token_data['access_token'] return True

# 语音合成

def text2audio(self, text, filename):

get_url = self.getvoice_url % (urllib2.quote(text), self.cu_id, self.token_str)

voice_data = urllib2.urlopen(get_url).read()

voice_fp = open(filename, 'wb+')

voice_fp.write(voice_data)

voice_fp.close()

return True

##语音识别

def audio2text(self, filename):

data = {}

data['format'] = 'wav'

data['rate'] = 8000

data['channel'] = 1

data['cuid'] = self.cu_id

data['token'] = self.token_str

wav_fp = open(filename, 'rb')

voice_data = wav_fp.read()

data['len'] = len(voice_data)

# data['speech'] = base64.b64encode(voice_data).decode('utf-8')

data['speech'] = base64.b64encode(voice_data).replace('', '')

# post_data = json.dumps(data)

result = requests.post(self.upvoice_url, json=data, headers={'Content-Type': 'application/json'})

data_result = result.json()

if(data_result['err_msg'] == 'success.'):

return data_result['result'][0] else:

return False

def test_voice(voice_file):

api_key = "vossGHIgEETS6IMRxBDeahv8"

api_secert = "3c1fe6a6312f41fa21fa2c394dad5510"

bdr = BaiduRest("0-57-7B-9F-1F-A1", api_key, api_secert)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论收藏

内容反馈

weixin_38587705

粉丝: 0
资源: 930

python调用百度语音识别实现大音频文件语音识别功能

评论0

最新资源

python调用百度语音识别实现大音频文件语音识别功能

评论0

Python 利用pydub库操作音频文件的方法

python实现播放音频和录音功能示例代码

Python阿里云音频转字幕源代码，使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写出 srt 字幕

c# 调用音频设备录音、语音播报、文本转Wav音频文件、Wav音频文件转文本(语音识别)

使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写出 srt 字幕.zip

基于语音识别接口智能语音识别和字幕推荐系统-深度学习算法应用（含全部工程源码）+测试数据集

人工智障语音聊天机器人.zip

浏览器麦克风实时录制音频流数据，通过websocket传输

Project_Of_SRTP:学校的srtp项目--基于语音识别的自动文本纠错系统

vad函数matlab代码-rVAD:Matlab和Python库提供了一种用于健壮的语音活动检测（rVAD）的无监督方法，如本文基于无监督的

voice_to_text.zip

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

大麦网抢票脚本【Python脚本】

Python数据分析项目实践，包括数据读取、评估、清洗、分析、可视化机器学习相关内容等

YOLOv8-火焰识别（火焰数据集+代码+GUI界面+内置训练好的模型文件）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

Python学习笔记(干货) 中文PDF完整版.pdf

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

人体姿态检测

抢购haiwei.rar

第十五届蓝桥杯python组.docx

Python 八股文.pdf

第十五届蓝桥杯大赛软件赛省赛-PythonA组题目

计算机毕业设计源码：基于python旅游推荐系统+爬虫+分析可视化 +django框架

最新资源

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料