Microsoft Speech SDK 5.1 入门 Microsoft Speech SDK 5.1 是微软推出的语音技术开发包,包括语音识别(Speech Recognition)和语音合成(Speech Synthesis)两方面的内容。该开发包提供了一个完整的语音引擎,支持多种语言的识别和朗读,包括英文、中文、日文等。 SAPI(The Microsoft Speech API)是 Microsoft Speech SDK 的核心组件,提供了一组接口对象,包括: 1. Voice Commands API:对应用程序进行控制,一般用于语音识别系统中。 2. Voice Dictation API:听写输入,即语音识别接口。 3. Voice Text API:完成从文字到语音的转换,即语音合成。 4. Voice Telephone API:语音识别和语音合成综合运用到电话系统之上,利用此接口可以建立一个电话应答系统。 5. Audio Objects API:封装了计算机发音系统。 SAPI 是架构在 COM 基础上的,因此可以在多种开发环境中使用,包括 Windows 程序、网页、VBA 和 EXCEL 的图表中。 安装 SAPI SDK 需要下载开发包,版本说明:Version: 5.1 发布日期: 8/8/2001 语音: English 下载尺寸: 2.0 MB - 288.8 MB。系统要求为 Windows 98 以上版本。 在使用 SAPI SDK 时,需要配置 vc 环境,包括设置编译环境和链接库路径。然后可以使用 SAPI 函数实现语音合成、语音识别等功能。 语音合成的应用是使用 SAPI 实现 TTS(Text to Speech),首先需要初始化语音接口,然后可以使用 SAPI 函数调用语音引擎实现语音合成。例如,可以使用 ISpVoice* pVoice 初始化语音接口,然后使用 pVoice->SetVolume(50) 设置音量。 Microsoft Speech SDK 5.1 提供了一个功能强大且灵活的语音开发环境,支持多种语言和多种开发环境,可以广泛应用于语音识别、语音合成、电话应答系统等领域。
剩余10页未读,继续阅读
- 粉丝: 2
- 资源: 11
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- (源码)基于SimPy和贝叶斯优化的流程仿真系统.zip
- (源码)基于Java Web的个人信息管理系统.zip
- (源码)基于C++和OTL4的PostgreSQL数据库连接系统.zip
- (源码)基于ESP32和AWS IoT Core的室内温湿度监测系统.zip
- (源码)基于Arduino的I2C协议交通灯模拟系统.zip
- coco.names 文件
- (源码)基于Spring Boot和Vue的房屋租赁管理系统.zip
- (源码)基于Android的饭店点菜系统.zip
- (源码)基于Android平台的权限管理系统.zip
- (源码)基于CC++和wxWidgets框架的LEGO模型火车控制系统.zip
- 1
- 2
前往页