- 全屏海报轮播大小:978KB(全屏海报轮播)永久免费 淘宝新旺铺2013专业版,基础版最新全屏轮播1920大图代码生成器一键安装 海报宽不限,高不限,可以自由调节,自动居中 正版淘宝2012新旺铺专业版特效SDK/CSS装修软件(全屏海报轮播)永久免费 淘宝新旺铺2013专业版,基础版最新全屏轮播1920大图代码生成器一键安装 海报宽不限,高不限,可以自由调节,自动居中 正版淘宝2012新旺铺专业版特效SDK/CSS装修软件5 1787浏览会员免费
- 通达2013原版大小:48MB绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第二个。绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第二个。5 583浏览会员免费
- 通达2013原版大小:24MB绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第三个。绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第三个。5 564浏览会员免费
- 通达2013原版大小:48MB绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第一个。 02下载地址: http://download.csdn.net/detail/xiaohuuzi/5179605 03下载地址: http://download.csdn.net/detail/xiaohuuzi/5179678绝对能用的通达OA2013版原版+破解版+OA精灵+IM1000用户补丁。 这是从麦枫和富阳上搜集的资料,汇总整合的。 现在好多破解版都不提供原版,以至于根本就不能用。本人经反复测试。这个绝对能用。 经过破解后,通达守护服务、即时通讯服务、邮件服务、POP3服务在每次电脑重启后需要手动开启。 OA好像不能显示天气。 OA精灵只测试了电脑客户端。其它的因为条件不允许,无法测试。请用过的给个测试报告。 由于级别有限,只能分三次上传。这是第一个。 02下载地址: http://download.csdn.net/detail/xiaohuuzi/5179605 03下载地址: http://download.csdn.net/detail/xiaohuuzi/51796785 596浏览会员免费
- Outlook大小:4MBOutlook_Express_6 for win7 win7中Outlook_Express_6 没有了,但他简洁,好用,这是从ie6中提取出来的,Outlook_Express_6 for win7 win7中Outlook_Express_6 没有了,但他简洁,好用,这是从ie6中提取出来的,4 620浏览会员免费
- 淘宝装修模板大小:1MB基础版+专业版店铺全屏轮播CSS代码生成器基础版+专业版店铺全屏轮播CSS代码生成器4 1225浏览会员免费
- Prezi大小:30MBPrezi Desktop 桌面版,可离线编辑, 内附延期教程,及工具Prezi Desktop 桌面版,可离线编辑, 内附延期教程,及工具5 193浏览会员免费
- HTML大小:114KB从网上整理优化的漂亮后台登录界面(模板),如果您自认为美工不太好的话、或者不想动脑筋去构思一个后台登录界面,那么请相信本款后台登录的界面模板会让您满意,因为它来自专业WEB前端设计师之手,采用经典的蓝色风格界面,大方简约,效果演示如上所示从网上整理优化的漂亮后台登录界面(模板),如果您自认为美工不太好的话、或者不想动脑筋去构思一个后台登录界面,那么请相信本款后台登录的界面模板会让您满意,因为它来自专业WEB前端设计师之手,采用经典的蓝色风格界面,大方简约,效果演示如上所示5 4711浏览会员免费
- 淘宝装修大小:953KB全屏海报轮播CSS代码代码生成器 一键安装修 淘宝网店旺铺基础版+专业版永久模板全套全屏海报轮播CSS代码代码生成器 一键安装修 淘宝网店旺铺基础版+专业版永久模板全套5 531浏览会员免费
- WebEx大小:5MBWebEx Recording Editor 包含WebEx Recorder及Editor Windows版。 Version 29.3.0.17099 2014年3月7日下载。WebEx Recording Editor 包含WebEx Recorder及Editor Windows版。 Version 29.3.0.17099 2014年3月7日下载。5 218浏览会员免费
- 数据清洗工具Kettel的初级教程,入门级的分享给大家5 1170浏览会员免费
- 二维码大小:738KB采用C#(VS2008)开发二维码BarCode案例经典,通过调用动态链接库(Dll)生成PDF417、QrCode、DataMatrix和HanXin二维条码,提供非托管接口调用方法,图像打印与串口读取典型方法,源码参考和详细文档说明采用C#(VS2008)开发二维码BarCode案例经典,通过调用动态链接库(Dll)生成PDF417、QrCode、DataMatrix和HanXin二维条码,提供非托管接口调用方法,图像打印与串口读取典型方法,源码参考和详细文档说明4 373浏览会员免费
- 主要包含如下内容: * SQL、索引、数据库设计、死锁; * 缓存Cache –提升页面加载速度/缓解DB压力 * 异步消息处理–Service Broker * Batch Jobs / Services * 系统架构 - System Architecture * Exception Management / Alert System * EntLib–企业开发类库4 189浏览会员免费
- 本文是EntLib.com 电子商务小组(http://www.EntLib.com )针对国内电子商务网站关于SEO的一些思考和建议,提供了一些常用的、简单可行的SEO行动方案。更 高级别的、有针对性的优化方案需要深入分析和探讨。 通过阅读本文,你可以实现如下目的: 1. 了解电子商务网站的一些基本SEO规范。 2. 了解一些免费的网站管理员工具。 3. 本文提供的SEO改进方案简单实用,实现成本很小,但长期效果明显,对网站业务非常有帮助。 本文的大部分建议都基于SEO基本知识和我们的电子商务实践, 同时也参考业内的SEO专家文章和搜索引擎公司的官方文档。本文的一些场景以礼品中心网(http://www.GiftCenter.cn )的内容为主进行分析,在此表示感谢。5 289浏览会员免费
- shp大小:129MB全国最全水系,线状+面状,shp矢量。全国最全水系,线状+面状,shp矢量全国最全水系,线状+面状,shp矢量。全国最全水系,线状+面状,shp矢量5 3322浏览会员免费
- B2B、B2C电子商务网站系统架构分析,值得拥有!5 362浏览会员免费
- 美萍电脑行业管理系统专业版2010v5,完美破解版大小:20MB美萍电脑行业管理系统专业版2010v5,完美破解版美萍电脑行业管理系统专业版2010v5,完美破解版3 508浏览会员免费
- RAR大小:72KBhttp://blog.csdn.net/lingerlanlan/article/details/38418277 京东评论情感分类器(基于bag-of-words模型) 数据集http://blog.csdn.net/lingerlanlan/article/details/38418277 京东评论情感分类器(基于bag-of-words模型) 数据集5 3380浏览会员免费
- asp.net大小:6MB1,网页对话 网站访客无需下载和安装任何插件及客户端软件,只需轻轻点击,即可与网站客服进行实时在线交流。 2,主动对话 网站客服可以向网站访客主动进行对话,其中包括发出对话邀请和直接对话两种方式,使客服人员有主动发掘客户的机会。 3,常用语预设 网站客服可以根据自己公司的特定需求预先设定常见问题应答内容,以节省响应时间。 4,对话转接 网站客服之间可灵活转接对话,实现类似集团电话的效果,以提高接待效率 5,访客来源追踪 网站客服可实时查看网站当前访客数量、来源位置及所在页面。 6,流量统计 (独立流量统计系统) 网站客服可实时查看网站的各种流量统计信息。 7,文件传送 在对话过程中,后台客服人员和访客可以相互传送文件。8,发送图片 后台客服人员可以直接进行图片发送, 9,历史记录查询 网站客服可在线查询历史对话纪录,支持各种复杂条件的高级查询。 10,数据分析 系统可对访客信息进行归类、整理和分析。 11,客服分组 在访客端相关页面嵌入相关分组访客在不同的页面访问时就有相对应的客服服务。如此贴心的设计在提高客服的工作效率的同时,当然也会提高访客的满意。 程序开发语言:asp.net C# MSSQL2000 拿去就可以自己经营客服网站或二次开发都可。1,网页对话 网站访客无需下载和安装任何插件及客户端软件,只需轻轻点击,即可与网站客服进行实时在线交流。 2,主动对话 网站客服可以向网站访客主动进行对话,其中包括发出对话邀请和直接对话两种方式,使客服人员有主动发掘客户的机会。 3,常用语预设 网站客服可以根据自己公司的特定需求预先设定常见问题应答内容,以节省响应时间。 4,对话转接 网站客服之间可灵活转接对话,实现类似集团电话的效果,以提高接待效率 5,访客来源追踪 网站客服可实时查看网站当前访客数量、来源位置及所在页面。 6,流量统计 (独立流量统计系统) 网站客服可实时查看网站的各种流量统计信息。 7,文件传送 在对话过程中,后台客服人员和访客可以相互传送文件。8,发送图片 后台客服人员可以直接进行图片发送, 9,历史记录查询 网站客服可在线查询历史对话纪录,支持各种复杂条件的高级查询。 10,数据分析 系统可对访客信息进行归类、整理和分析。 11,客服分组 在访客端相关页面嵌入相关分组访客在不同的页面访问时就有相对应的客服服务。如此贴心的设计在提高客服的工作效率的同时,当然也会提高访客的满意。 程序开发语言:asp.net C# MSSQL2000 拿去就可以自己经营客服网站或二次开发都可。4 555浏览会员免费
- Microsoft.office2003中大小:5MBMicrosoft.office2003中的OCR组件.Microsoft.office2003中的OCR组件.3 429浏览会员免费
- Epson大小:1MBepson L4158 L4168 废墨收集垫清零软件,一定要用usb联接。能识别出打印机型号 L416X,L415X系列。能读出废墨收集主计数器等信息,由于我的打印机废墨收集垫使用了30%,就没有按下确认清零选项。 网上找了很久,有的要收费,有的是时间很久的版本。 这个软件看了修改日期是2020年的。 另, 三次清洗以后依然无效,将打印机放置1-2小时以后再执行深度打印头清洗。 要进行深度清洗的时候,需要您注意一下,深度清洗前,需要静置打印机两小时,深度清洗需要墨水在三分之一以上,这个深度清洗大约需要10分钟左右,期间您不要对打印机进行操作。(深度清洗最多执行一次)。 如打印机长期不使用,为了防止打印机堵头,建议定期开关打印机,比如一周一次。. 尽量多打打,防止堵头。尽可能避免深度清洗。希望用不到这个废墨收集垫清零软件。epson L4158 L4168 废墨收集垫清零软件,一定要用usb联接。能识别出打印机型号 L416X,L415X系列。能读出废墨收集主计数器等信息,由于我的打印机废墨收集垫使用了30%,就没有按下确认清零选项。 网上找了很久,有的要收费,有的是时间很久的版本。 这个软件看了修改日期是2020年的。 另, 三次清洗以后依然无效,将打印机放置1-2小时以后再执行深度打印头清洗。 要进行深度清洗的时候,需要您注意一下,深度清洗前,需要静置打印机两小时,深度清洗需要墨水在三分之一以上,这个深度清洗大约需要10分钟左右,期间您不要对打印机进行操作。(深度清洗最多执行一次)。 如打印机长期不使用,为了防止打印机堵头,建议定期开关打印机,比如一周一次。. 尽量多打打,防止堵头。尽可能避免深度清洗。希望用不到这个废墨收集垫清零软件。5 5868浏览免费
- PDF大小:3MB专业CAD,excel,word等pdf打印软件专业CAD,excel,word等pdf打印软件4 671浏览会员免费
- 商品图片下载大小:14MB该软件是一款完全免费的,用来采集店铺图片资源的工具,支持一键下载商品详情页所有的主图、sku图和商品详情页,评论图等资源。并支持所有市面上的店铺,可以通过简单的配置即可收集更多的店铺。包括淘宝、天猫、拼多多、抖音、京东等店铺。 1、支持淘宝收集的图片。 2、支持天猫收集的图片。 3、支持拼多多等收集的图片下载。 4、支持通用的网页的图片,比如蘑菇街等。 5、支持需要登录网页才能下载的图片。 另外:软件支持自定义规则,改改js就可以下载任何网站上面的图片。该软件是一款完全免费的,用来采集店铺图片资源的工具,支持一键下载商品详情页所有的主图、sku图和商品详情页,评论图等资源。并支持所有市面上的店铺,可以通过简单的配置即可收集更多的店铺。包括淘宝、天猫、拼多多、抖音、京东等店铺。 1、支持淘宝收集的图片。 2、支持天猫收集的图片。 3、支持拼多多等收集的图片下载。 4、支持通用的网页的图片,比如蘑菇街等。 5、支持需要登录网页才能下载的图片。 另外:软件支持自定义规则,改改js就可以下载任何网站上面的图片。2 5079浏览免费
- 数据挖掘大小:49MB本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章:前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。 本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章:前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。 本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。5 1371浏览会员免费
- rocketmq大小:21MBrocketmq管理界面,下载发布到tomcat下,修改config.properties中的rocketmq.namesrv.addr参数即可。该参数为nameserver的地址rocketmq管理界面,下载发布到tomcat下,修改config.properties中的rocketmq.namesrv.addr参数即可。该参数为nameserver的地址5 685浏览会员免费
- Java大小:21MBJava网上商城项目源码 开发工具:MyEclipse 6.5 数据库: MySQL 服务器:TOMCAT 先导入数据库,然后部署到服务器,启动 在浏览器地址栏输入:http://localhost:8080/myshop/index.do即可进入 在主页上有一个logo 点击即可进入后台超级用户名密码为:severus/severus 如果不好使可以输入http://localhost:8080/myshop/back_index.do 这是我今年年初做练习时做的一个网上商城项目,基本上的功能都有 主要实现用户网上购物。主要提供了用户注册、登录、个人信息修改、 查看商品(按全部、类型、点击率、销售排行)、查看商品详情、添加购物车、 生成定单、论坛评论、投诉等功能。后台主要实现对商品、用户、订单、产品类型、 管理员,以及付款方式等管理功能。 准备时间大概三个星期,真正写代码用了两周,看到网上有很多人都在找网上商城的源代码 因此,我把我这个上传共享一下,不为别的,只为能给需要的人一点借鉴。 当然,当初我做这个纯属练习,已经是快一年过去了 ,现在看起来我都觉得自己做的太可笑了,很多就功能都不全 甚至是幼稚,希望不要笑话我,你可以根据自己的需要更改,完善!!! 另外,为了方便大家,同时我也附上了在网上找的一个链接网上银行的代码,希望能给你有所帮助!Java网上商城项目源码 开发工具:MyEclipse 6.5 数据库: MySQL 服务器:TOMCAT 先导入数据库,然后部署到服务器,启动 在浏览器地址栏输入:http://localhost:8080/myshop/index.do即可进入 在主页上有一个logo 点击即可进入后台超级用户名密码为:severus/severus 如果不好使可以输入http://localhost:8080/myshop/back_index.do 这是我今年年初做练习时做的一个网上商城项目,基本上的功能都有 主要实现用户网上购物。主要提供了用户注册、登录、个人信息修改、 查看商品(按全部、类型、点击率、销售排行)、查看商品详情、添加购物车、 生成定单、论坛评论、投诉等功能。后台主要实现对商品、用户、订单、产品类型、 管理员,以及付款方式等管理功能。 准备时间大概三个星期,真正写代码用了两周,看到网上有很多人都在找网上商城的源代码 因此,我把我这个上传共享一下,不为别的,只为能给需要的人一点借鉴。 当然,当初我做这个纯属练习,已经是快一年过去了 ,现在看起来我都觉得自己做的太可笑了,很多就功能都不全 甚至是幼稚,希望不要笑话我,你可以根据自己的需要更改,完善!!! 另外,为了方便大家,同时我也附上了在网上找的一个链接网上银行的代码,希望能给你有所帮助!4 2176浏览会员免费
- 购物篮大小:4MB整理了我一个星期,终于搞出来了,某超市八月份的销售购物篮数据集,其中第一列是小票号+柜员机号+收银员号,其他的是一些物品分类的项目,可以用于clementine的关联分析。但是因为分类比较大,所以无法挖掘出排斥商品的关联规则。整理了我一个星期,终于搞出来了,某超市八月份的销售购物篮数据集,其中第一列是小票号+柜员机号+收银员号,其他的是一些物品分类的项目,可以用于clementine的关联分析。但是因为分类比较大,所以无法挖掘出排斥商品的关联规则。4 2422浏览会员免费
- 淘宝客大小:29MB演示站:www.fangpian.ren,商品自动更新,手机打开带淘口令,源码免费。演示站:www.fangpian.ren,商品自动更新,手机打开带淘口令,源码免费。4 922浏览会员免费
- bpmn2.0规范的最终正式版,涵盖了状态机、协作流程、业务流程等等5 897浏览会员免费
- WPS大小:197MB免费的WPS、搬来的,为啥要50个字啊,好麻烦啊,啥时候能少点啊,不熬夜不追剧~( ̄▽ ̄)~*免费的WPS、搬来的,为啥要50个字啊,好麻烦啊,啥时候能少点啊,不熬夜不追剧~( ̄▽ ̄)~*5 3931浏览免费
- vishay 贴片电感系列封装、型号、特性,报价。供设计参考使用。5 806浏览会员免费
- WebEx大小:2MBWebEx Player for Mac. 可以在Mac OS上播放WebEx Recorder生成的wrf的文件。 2014年3月7日思科webex官网下载。WebEx Player for Mac. 可以在Mac OS上播放WebEx Recorder生成的wrf的文件。 2014年3月7日思科webex官网下载。4 450浏览会员免费
- fwa大小:20KB烟花算法matlab源代码,本代码是烟花算法的基本代码,有助于学习算法及其优化算法的同学快速入门烟花算法matlab源代码,本代码是烟花算法的基本代码,有助于学习算法及其优化算法的同学快速入门5 3724浏览会员免费
- 图片文字提取大小:31MB1、 OCR用法简介 1)打开带有文字的图片,根据所要提取的文字进行裁剪(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片)。 2)启动紫光OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别”按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果复制粘贴至其他文档中即可。 2、尚书六号用法简介 1)进入"尚书六号"的界面,界面如下: 2)导入需要提取的图片,点击"文件",选择"打开图象页" 选择刚才保存的sample.jpg并点击"打开" 3)点击识别,开始进行识别 "尚书六号"自动识别的三个选框 4)提取文字并保存文本 不修改默认设置,直接点击"识别"后,弹出的界面 将框内的文字选中,并复制到文本文件或Word文档进行个别错字修正即可。1、 OCR用法简介 1)打开带有文字的图片,根据所要提取的文字进行裁剪(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片)。 2)启动紫光OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别”按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果复制粘贴至其他文档中即可。 2、尚书六号用法简介 1)进入"尚书六号"的界面,界面如下: 2)导入需要提取的图片,点击"文件",选择"打开图象页" 选择刚才保存的sample.jpg并点击"打开" 3)点击识别,开始进行识别 "尚书六号"自动识别的三个选框 4)提取文字并保存文本 不修改默认设置,直接点击"识别"后,弹出的界面 将框内的文字选中,并复制到文本文件或Word文档进行个别错字修正即可。4 710浏览会员免费
- asp大小:665KBasp 将数据库access或sql及mysql查询的数据导出到excel,已经把相关文件全部打包,放到站点上就可以测试。确保能用。本人已经应用!asp 将数据库access或sql及mysql查询的数据导出到excel,已经把相关文件全部打包,放到站点上就可以测试。确保能用。本人已经应用!5 566浏览会员免费
- java大小:639KBjava向EXCEL中写入数据。里面有一个ExcelWrite.java的文件和一个jxl的jar包。java向EXCEL中写入数据。里面有一个ExcelWrite.java的文件和一个jxl的jar包。4 6591浏览会员免费
- msn,消息,邮件,提示音大小:48KB经典的 msn消息提示音收藏,适用于各类流行邮件客户端;提供msn消息提示音.zip下载,有喜欢的赶快下载吧经典的 msn消息提示音收藏,适用于各类流行邮件客户端;提供msn消息提示音.zip下载,有喜欢的赶快下载吧5 1299浏览会员免费
- 破天窝窝大小:2MB破天窝窝3.0 绿色免安装破解版破天窝窝3.0 绿色免安装破解版4 2236浏览会员免费
- java大小:41MBjava开源B2C LegendShop_UTF8_B2C_3.0.3.2 war包java开源B2C LegendShop_UTF8_B2C_3.0.3.2 war包4 374浏览会员免费
- 推荐系统大小:7MB基于邻域推荐算法中,基于物品的协调过滤推荐算法 itemCF 的visual c++ 的实现代码,MovieLens数据集。基于邻域推荐算法中,基于物品的协调过滤推荐算法 itemCF 的visual c++ 的实现代码,MovieLens数据集。5 1257浏览会员免费
- sphinx大小:53MB本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。 本文档编写日期 2013-04-23 1、为什么要训练? sphinx4目前的版本中仅提供了英文等语音识别库。中文的库是PTM或semi类型的,在java版sphinx中无法使用。 2、Sphinx的训练指哪些内容? 在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容: a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注 这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。 下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。 昌 ch ang 昌北 ch ang b ei 昌必 ch ang b i 昌都 ch ang d u 昌赫 ch ang h e a2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何 由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。 因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。 a3、需要告诉sphinx每个字、词的真正读音 发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。 因此sphinx需要学习说话人的“口音”。 如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。 推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。 3、如何准备训练内容所需的原料? 需要准备两大内容:1)文本语料文件,2)语料录音文件。 文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。 它以行为单位,给出了150个中文句子。 语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。 语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。 4、训练环境及注意事项 本文的训练软硬件如下: 硬件:T60P笔记本,机器自带录音设备;操作系统为Win7 32位。 软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版 注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用 文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。 在保存前,设置格式如下: 换行符:UNIX终束符 - LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8 - 无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。 录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框 选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps) 5、训练步骤 下面逐步从零开始进行训练 5.1 软件环境的安装 将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt 1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi; 2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下 3)安装audacity-win-2.0.3rc1.zip和FairStars.zip 4)安装UltraEdit-32.rar(绿色,解压即可) 5.2 准备文本语料 这里需要使用我们提供的脚本对berginput.txt进行处理,得到所需的文件。 1)将d:\sphinxtrain\cnprepare.py剪切到D:\sphinxtrain\sphinxtrain-1.0.8-win32\python目录。 2)将d:\sphinxtrain\jieba.rar解压到D:\sphinxtrain\sphinxtrain-1.0.8-win32\python目录, 确保jieba.rar中的文件dict.txt解压后的目录是D:\sphinxtrain\sphinxtrain-1.0.8-win32\python\jieba\dict.txt jieba.rar是一个python下的中文分词模块,主页是https://github.com/fxsjy/jieba 3)打开一个DOS命令行(这个应该都知道吧),运行下面的命令 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\python\cnprepare.py D:\sphinxtrain\zh_broadcastnews_utf8.dic D:\sphinxtrain\bergtrain\etc\berginput.txt D:\sphinxtrain\bergtrain\etc\bergtrain.txt D:\sphinxtrain\bergtrain\etc\bergtrain_train.transcription D:\sphinxtrain\bergtrain\etc\bergtrain.dic D:\sphinxtrain\bergtrain\etc\bergtrain_train.fileids cnprepare.py命令的格式是cnprepare <dictMapFile> <inFile> <txtFile> <tranFile> <dicFile> <fileidFile> dictMapFile是发音字典文件,上面的是zh_broadcastnews_utf8.dic,我们删除里面的数字和英文。 inFile是准备好的领域内语料文本,例如berginput.txt里关于图形用户界面和语音朗读、计算机方面的文本。 txtFile是将输出用于sphinx进行统计的语料文件 tranFile是sphinx中的transcription文件,它告诉sphinx将要训练的语句有哪些。 dicFile是transcription文件语句中所有单词的发音字典,显然它是dictMapFile的一个覆盖inFile的子集。 fileids告诉sphinxtranscription文件中每条语句对应的发音文件。 上面的命令行为我们准备好了训练时需要的语料信息,还有三个文件需要准备: bergtrain.filler 告诉sphinx,transcription文件中一些不需要处理的哑元符号,这个文件已经自带了。 bergtrain_test.fileids bergtrain_test.transcription 用于测试的transcription文件和语音对应文件,可以直接拷贝用于训练的两个文件,命令行如下: copy D:\sphinxtrain\bergtrain\etc\bergtrain_train.transcription D:\sphinxtrain\bergtrain\etc\bergtrain_test.transcription copy D:\sphinxtrain\bergtrain\etc\bergtrain_train.fileids D:\sphinxtrain\bergtrain\etc\bergtrain_test.fileids 5.3 录音 如果打开5.2中生成的bergtrain_train.fileids文件,可以看到一下片断: speaker_1/1_1 speaker_1/1_2 speaker_1/1_3 speaker_1/1_4 speaker_1/1_5 speaker_1/1_6 它告诉sphinx在训练时如何找到句子的读音。以speaker_1/1_4为例,它指示sphinx, 对于bergtrain_train.transcription中的第4个句子,读音文件是 D:\sphinxtrain\bergtrain\wav\speaker_1\1_4.wav。 读音文件的格式和扩展名可以在后面生成的训练配置文件中修改,幸运的是如果按照4中的格式进行录音,就不需要修改。 录音可以采用FairStars软件,它支持批量录音,设定你喜欢的快捷键,可以使你的录音过程轻松得多。 好吧,我们提供了一份个人的录音文件,原始信息在D:\sphinxtrain\bergtrain\wav原始\speaker_1中, D:\sphinxtrain\bergtrain\wav\speaker_1中的是经过audacity进行归一化处理的语音文件。 6、开始训练 我们已经按照sphinx的教程准备好了训练用的命令行,分为三部分:生成训练目录、语料预处理、训练与测试。 6.1 使用下面的命令行,告诉sphinx我们要在bergtrain目录下进行训练 rem 进入bergtrain目录 cd D:\sphinxtrain\bergtrain d: rem 建立训练环境bergtrain rem 会在bergtrain目录下生成etc目录(feat.params和sphinx_train.cfg) python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain -t bergtrain setup 6.2 语料预处理的脚本如下,拷贝到命令行中运行即可: rem 进入etc目录 cd D:\sphinxtrain\bergtrain\etc\ d: rem 将语料文件转换生成DMP文件 D:\sphinxtrain\cmuclmtk-0.7-win32\text2wfreq < bergtrain.txt > bergtrain.wfreq D:\sphinxtrain\cmuclmtk-0.7-win32\wfreq2vocab < bergtrain.wfreq > bergtrain.vocab D:\sphinxtrain\cmuclmtk-0.7-win32\text2idngram -vocab bergtrain.vocab -idngram bergtrain.idngram < bergtrain.txt D:\sphinxtrain\cmuclmtk-0.7-win32\idngram2lm -idngram bergtrain.idngram -vocab bergtrain.vocab -arpa bergtrain.arpa D:\sphinxtrain\sphinxbase-0.8-win32\bin\Release\sphinx_lm_convert -i bergtrain.arpa -o bergtrain.lm.DMP rem 生成.phone文件 D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\prepare\make_phoneset.pl bergtrain.dic bergtrain.filler > bergtrain.phone 6.3 训练和测试的脚本你如下,拷贝到命令行中运行即可。训练的时间根据语料多少和机器性能而定,我的训练花了5分钟的样子。 rem 进入bergtrain目录 cd D:\sphinxtrain\bergtrain d: rem 开始进行运行训练 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain run rem 运行测试,可以不执行测试 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain -s decode run 7、试验和使用 训练完毕,将需要的文件拷贝到test目录中,运行命令进行朗读测试,所需的脚本如下: rem 拷贝需要的文件 rem 创建目标目录并拷贝数据文件 md D:\sphinxtrain\bergtrain\test\bergtrain.cd_cont_200 copy /Y D:\sphinxtrain\bergtrain\model_parameters\bergtrain.cd_cont_200\*.* D:\sphinxtrain\bergtrain\test\bergtrain.cd_cont_200\ rem 拷贝字典和语料文件 copy /Y D:\sphinxtrain\bergtrain\etc\bergtrain.dic D:\sphinxtrain\bergtrain\test\bergtrain.dic copy /Y D:\sphinxtrain\bergtrain\etc\bergtrain.lm.DMP D:\sphinxtrain\bergtrain\test\bergtrain.lm.DMP rem 进入测试目录,启动测试程序 cd D:\sphinxtrain\bergtrain\test d: pocketsphinx_continuous -hmm bergtrain.cd_cont_200 -lm bergtrain.lm.DMP -dict bergtrain.dic 开始测试后,可以朗读内容,例如“计算机”,会有如下的输出。 INFO: ngram_search.c(1266): lattice start node <s>.0 end node 璁$畻鏈?2 INFO: ngram_search.c(1294): Eliminated 40 nodes before end node INFO: ngram_search.c(1399): Lattice has 84 nodes, 1 links INFO: ps_lattice.c(1365): Normalizer P(O) = alpha(璁$畻鏈?2:104) = -256768 INFO: ps_lattice.c(1403): Joint P(O,S) = -256768 P(S|O) = 0 INFO: ngram_search.c(888): bestpath 0.00 CPU 0.000 xRT INFO: ngram_search.c(891): bestpath 0.01 wall 0.010 xRT 000000002: 璁$畻鏈? READY.... 注意,由于编码的原因,出现的是乱码,拷贝该乱码; 到ultraedit中,新建一个文件,粘贴,使用utf8转ascii,就可以看到正确的内容了。 上面的貌似被识别成了(计算暿)。 在sphinx4的java中使用上面训练的成果,简单的方法是将bergtrain.cd_cont_200目录下的文件连同 bergtrain.dic、bergtrain.lm.DMP文件,放入一个目录(如bergtrain),将该目录压缩为一个zip文件, 重命名为jar文件,然后参考sphinx4的hello world修改其中的配置文件,使之使用我们提供的jar包即可。 注意,要把jar包放到classpath哦。 经过个人的测试,识别率还是比较高的。 8、总结与问题 总的来讲,训练时只需要提供语料文件和录音文件,形式上比较简单,但要给一个好的语料文件还需要不断试验。 上面的步骤和脚本都是根据sphinx的文档来的。需要注意的是,版本不同,内容可能也会不同。 8.1 中文的字和词的问题 中文和英文的一个差别是:英文的单词之间有空格,而中文没有。而sphinx显然是按照空格来划分单词的。 因此,进行中文训练前需要进行分词,即为字和词之间添加空格。例如: 命令的层次根据应用程序的不同而不同。 将被分为: <s> 命令 的 层次 根据 应用程序 的 不同 而 不同 </s> 当然,你也可以直接将它分割为单个的字,即: <s> 命 令 的 层 次 根 据 应 用 程 序 的 不 同 而 不 同 </s> 分词的优点是“可能”提高识别率。 由于中文的这一特点,在java中使用sphinx定义语法文件时,需要做额外的工作。 例如定义下面的语法 (我们) (是|不是) (好孩子 | 计算机高手) 可能会因为bergtrain.dic中不存在“计算机高手”而报错,解决的办法如下: 1、复杂型:使用分词将“计算机高手”划分到bergtrain.dic所包含的 “计算机 高手”。 2、简单型:直接添加空格,划分为“计 算 机 高 手”。 总之就是要使每个词在bergtrain.dic中,同时又符合语法。 8.2 中文、英文和数字的混合训练 在语料文件中添加包括英文和数字的语句, 在发音字典中确保新的单词和数字有对应的发音即可。 结巴分词可以处理中文、英文和数字混合的文件。 ——你可以按照上面的教程直接进行训练,而无需下载附件。当然,下载后评价一下,也可以回收你的1分。 由于csdn的文件大小限制,只能将用到的软件都删除了,请自行下载或找我直接要吧。本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。 本文档编写日期 2013-04-23 1、为什么要训练? sphinx4目前的版本中仅提供了英文等语音识别库。中文的库是PTM或semi类型的,在java版sphinx中无法使用。 2、Sphinx的训练指哪些内容? 在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容: a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注 这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。 下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。 昌 ch ang 昌北 ch ang b ei 昌必 ch ang b i 昌都 ch ang d u 昌赫 ch ang h e a2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何 由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。 因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。 a3、需要告诉sphinx每个字、词的真正读音 发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。 因此sphinx需要学习说话人的“口音”。 如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。 推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。 3、如何准备训练内容所需的原料? 需要准备两大内容:1)文本语料文件,2)语料录音文件。 文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。 它以行为单位,给出了150个中文句子。 语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。 语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。 4、训练环境及注意事项 本文的训练软硬件如下: 硬件:T60P笔记本,机器自带录音设备;操作系统为Win7 32位。 软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版 注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用 文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。 在保存前,设置格式如下: 换行符:UNIX终束符 - LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8 - 无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。 录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框 选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps) 5、训练步骤 下面逐步从零开始进行训练 5.1 软件环境的安装 将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt 1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi; 2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下 3)安装audacity-win-2.0.3rc1.zip和FairStars.zip 4)安装UltraEdit-32.rar(绿色,解压即可) 5.2 准备文本语料 这里需要使用我们提供的脚本对berginput.txt进行处理,得到所需的文件。 1)将d:\sphinxtrain\cnprepare.py剪切到D:\sphinxtrain\sphinxtrain-1.0.8-win32\python目录。 2)将d:\sphinxtrain\jieba.rar解压到D:\sphinxtrain\sphinxtrain-1.0.8-win32\python目录, 确保jieba.rar中的文件dict.txt解压后的目录是D:\sphinxtrain\sphinxtrain-1.0.8-win32\python\jieba\dict.txt jieba.rar是一个python下的中文分词模块,主页是https://github.com/fxsjy/jieba 3)打开一个DOS命令行(这个应该都知道吧),运行下面的命令 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\python\cnprepare.py D:\sphinxtrain\zh_broadcastnews_utf8.dic D:\sphinxtrain\bergtrain\etc\berginput.txt D:\sphinxtrain\bergtrain\etc\bergtrain.txt D:\sphinxtrain\bergtrain\etc\bergtrain_train.transcription D:\sphinxtrain\bergtrain\etc\bergtrain.dic D:\sphinxtrain\bergtrain\etc\bergtrain_train.fileids cnprepare.py命令的格式是cnprepare <dictMapFile> <inFile> <txtFile> <tranFile> <dicFile> <fileidFile> dictMapFile是发音字典文件,上面的是zh_broadcastnews_utf8.dic,我们删除里面的数字和英文。 inFile是准备好的领域内语料文本,例如berginput.txt里关于图形用户界面和语音朗读、计算机方面的文本。 txtFile是将输出用于sphinx进行统计的语料文件 tranFile是sphinx中的transcription文件,它告诉sphinx将要训练的语句有哪些。 dicFile是transcription文件语句中所有单词的发音字典,显然它是dictMapFile的一个覆盖inFile的子集。 fileids告诉sphinxtranscription文件中每条语句对应的发音文件。 上面的命令行为我们准备好了训练时需要的语料信息,还有三个文件需要准备: bergtrain.filler 告诉sphinx,transcription文件中一些不需要处理的哑元符号,这个文件已经自带了。 bergtrain_test.fileids bergtrain_test.transcription 用于测试的transcription文件和语音对应文件,可以直接拷贝用于训练的两个文件,命令行如下: copy D:\sphinxtrain\bergtrain\etc\bergtrain_train.transcription D:\sphinxtrain\bergtrain\etc\bergtrain_test.transcription copy D:\sphinxtrain\bergtrain\etc\bergtrain_train.fileids D:\sphinxtrain\bergtrain\etc\bergtrain_test.fileids 5.3 录音 如果打开5.2中生成的bergtrain_train.fileids文件,可以看到一下片断: speaker_1/1_1 speaker_1/1_2 speaker_1/1_3 speaker_1/1_4 speaker_1/1_5 speaker_1/1_6 它告诉sphinx在训练时如何找到句子的读音。以speaker_1/1_4为例,它指示sphinx, 对于bergtrain_train.transcription中的第4个句子,读音文件是 D:\sphinxtrain\bergtrain\wav\speaker_1\1_4.wav。 读音文件的格式和扩展名可以在后面生成的训练配置文件中修改,幸运的是如果按照4中的格式进行录音,就不需要修改。 录音可以采用FairStars软件,它支持批量录音,设定你喜欢的快捷键,可以使你的录音过程轻松得多。 好吧,我们提供了一份个人的录音文件,原始信息在D:\sphinxtrain\bergtrain\wav原始\speaker_1中, D:\sphinxtrain\bergtrain\wav\speaker_1中的是经过audacity进行归一化处理的语音文件。 6、开始训练 我们已经按照sphinx的教程准备好了训练用的命令行,分为三部分:生成训练目录、语料预处理、训练与测试。 6.1 使用下面的命令行,告诉sphinx我们要在bergtrain目录下进行训练 rem 进入bergtrain目录 cd D:\sphinxtrain\bergtrain d: rem 建立训练环境bergtrain rem 会在bergtrain目录下生成etc目录(feat.params和sphinx_train.cfg) python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain -t bergtrain setup 6.2 语料预处理的脚本如下,拷贝到命令行中运行即可: rem 进入etc目录 cd D:\sphinxtrain\bergtrain\etc\ d: rem 将语料文件转换生成DMP文件 D:\sphinxtrain\cmuclmtk-0.7-win32\text2wfreq < bergtrain.txt > bergtrain.wfreq D:\sphinxtrain\cmuclmtk-0.7-win32\wfreq2vocab < bergtrain.wfreq > bergtrain.vocab D:\sphinxtrain\cmuclmtk-0.7-win32\text2idngram -vocab bergtrain.vocab -idngram bergtrain.idngram < bergtrain.txt D:\sphinxtrain\cmuclmtk-0.7-win32\idngram2lm -idngram bergtrain.idngram -vocab bergtrain.vocab -arpa bergtrain.arpa D:\sphinxtrain\sphinxbase-0.8-win32\bin\Release\sphinx_lm_convert -i bergtrain.arpa -o bergtrain.lm.DMP rem 生成.phone文件 D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\prepare\make_phoneset.pl bergtrain.dic bergtrain.filler > bergtrain.phone 6.3 训练和测试的脚本你如下,拷贝到命令行中运行即可。训练的时间根据语料多少和机器性能而定,我的训练花了5分钟的样子。 rem 进入bergtrain目录 cd D:\sphinxtrain\bergtrain d: rem 开始进行运行训练 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain run rem 运行测试,可以不执行测试 python D:\sphinxtrain\sphinxtrain-1.0.8-win32\scripts\sphinxtrain -s decode run 7、试验和使用 训练完毕,将需要的文件拷贝到test目录中,运行命令进行朗读测试,所需的脚本如下: rem 拷贝需要的文件 rem 创建目标目录并拷贝数据文件 md D:\sphinxtrain\bergtrain\test\bergtrain.cd_cont_200 copy /Y D:\sphinxtrain\bergtrain\model_parameters\bergtrain.cd_cont_200\*.* D:\sphinxtrain\bergtrain\test\bergtrain.cd_cont_200\ rem 拷贝字典和语料文件 copy /Y D:\sphinxtrain\bergtrain\etc\bergtrain.dic D:\sphinxtrain\bergtrain\test\bergtrain.dic copy /Y D:\sphinxtrain\bergtrain\etc\bergtrain.lm.DMP D:\sphinxtrain\bergtrain\test\bergtrain.lm.DMP rem 进入测试目录,启动测试程序 cd D:\sphinxtrain\bergtrain\test d: pocketsphinx_continuous -hmm bergtrain.cd_cont_200 -lm bergtrain.lm.DMP -dict bergtrain.dic 开始测试后,可以朗读内容,例如“计算机”,会有如下的输出。 INFO: ngram_search.c(1266): lattice start node <s>.0 end node 璁$畻鏈?2 INFO: ngram_search.c(1294): Eliminated 40 nodes before end node INFO: ngram_search.c(1399): Lattice has 84 nodes, 1 links INFO: ps_lattice.c(1365): Normalizer P(O) = alpha(璁$畻鏈?2:104) = -256768 INFO: ps_lattice.c(1403): Joint P(O,S) = -256768 P(S|O) = 0 INFO: ngram_search.c(888): bestpath 0.00 CPU 0.000 xRT INFO: ngram_search.c(891): bestpath 0.01 wall 0.010 xRT 000000002: 璁$畻鏈? READY.... 注意,由于编码的原因,出现的是乱码,拷贝该乱码; 到ultraedit中,新建一个文件,粘贴,使用utf8转ascii,就可以看到正确的内容了。 上面的貌似被识别成了(计算暿)。 在sphinx4的java中使用上面训练的成果,简单的方法是将bergtrain.cd_cont_200目录下的文件连同 bergtrain.dic、bergtrain.lm.DMP文件,放入一个目录(如bergtrain),将该目录压缩为一个zip文件, 重命名为jar文件,然后参考sphinx4的hello world修改其中的配置文件,使之使用我们提供的jar包即可。 注意,要把jar包放到classpath哦。 经过个人的测试,识别率还是比较高的。 8、总结与问题 总的来讲,训练时只需要提供语料文件和录音文件,形式上比较简单,但要给一个好的语料文件还需要不断试验。 上面的步骤和脚本都是根据sphinx的文档来的。需要注意的是,版本不同,内容可能也会不同。 8.1 中文的字和词的问题 中文和英文的一个差别是:英文的单词之间有空格,而中文没有。而sphinx显然是按照空格来划分单词的。 因此,进行中文训练前需要进行分词,即为字和词之间添加空格。例如: 命令的层次根据应用程序的不同而不同。 将被分为: <s> 命令 的 层次 根据 应用程序 的 不同 而 不同 </s> 当然,你也可以直接将它分割为单个的字,即: <s> 命 令 的 层 次 根 据 应 用 程 序 的 不 同 而 不 同 </s> 分词的优点是“可能”提高识别率。 由于中文的这一特点,在java中使用sphinx定义语法文件时,需要做额外的工作。 例如定义下面的语法 (我们) (是|不是) (好孩子 | 计算机高手) 可能会因为bergtrain.dic中不存在“计算机高手”而报错,解决的办法如下: 1、复杂型:使用分词将“计算机高手”划分到bergtrain.dic所包含的 “计算机 高手”。 2、简单型:直接添加空格,划分为“计 算 机 高 手”。 总之就是要使每个词在bergtrain.dic中,同时又符合语法。 8.2 中文、英文和数字的混合训练 在语料文件中添加包括英文和数字的语句, 在发音字典中确保新的单词和数字有对应的发音即可。 结巴分词可以处理中文、英文和数字混合的文件。 ——你可以按照上面的教程直接进行训练,而无需下载附件。当然,下载后评价一下,也可以回收你的1分。 由于csdn的文件大小限制,只能将用到的软件都删除了,请自行下载或找我直接要吧。5 1153浏览会员免费
- office2003大小:16KBoffice2003 提示要Pro11.msi错误解决办法. 把office.rar 解压运行 office.reg 导入注册表。 Office2003就成功修复了。 这个方法是我独创的,哈哈。office2003 提示要Pro11.msi错误解决办法. 把office.rar 解压运行 office.reg 导入注册表。 Office2003就成功修复了。 这个方法是我独创的,哈哈。4 283浏览会员免费
- 《CISSP认证考试指南(第6版)》针对最新发布的信息系统安全专家考试做了全面修订,它全面、最新地覆盖了(ISC)2开发的CISSP考试的所有10个专业领域。这本权威的考试指南 在每一章的开始都给出了学习目标、考试技巧、实践问题和深入的解释。 《CISSP认证考试指南(第6版)》由IT安全认证和培训的首席专家撰写,将帮助您轻松地通过考试,也可以作为工作的一本重要参考书。4 206浏览会员免费
- 二维码大小:917KBVC制作PDF417,Qr_Code,DataMatrix二维条码编码,VB程序演示,有完整的详细接口说明,完整的DEMO,包括条码读码,是制作二维条码的经典作品。 以动态库(DLL)方式提供图片格式的二维条码解码,供二次开发。 ● 生成PDF417、QR Code、DataMatrix等二维条码; ● QR码和DataMatrix码提供条码图象黑白二值信息缓存接口,便于激光机和雕刻机的操作; ● 二维条码生成控件能将文字(任何语种的文字)、二进制数、照片(可压缩)、掌纹、指纹、声音、签名等信息编码生成二维条码,并可实施信息加密; ● DLL产品以结构形式设置条码各参数; ● 提供串口设置及调用函数; ● 通用性强,普遍适合一般串口通信传输。 以动态库(DLL)方式提供人像照片压缩控件,以便用来生成二维条码。 ● 使用先进压缩技术,压缩比高,失真小; ● 压缩后的图片可控制在1K以内;VC制作PDF417,Qr_Code,DataMatrix二维条码编码,VB程序演示,有完整的详细接口说明,完整的DEMO,包括条码读码,是制作二维条码的经典作品。 以动态库(DLL)方式提供图片格式的二维条码解码,供二次开发。 ● 生成PDF417、QR Code、DataMatrix等二维条码; ● QR码和DataMatrix码提供条码图象黑白二值信息缓存接口,便于激光机和雕刻机的操作; ● 二维条码生成控件能将文字(任何语种的文字)、二进制数、照片(可压缩)、掌纹、指纹、声音、签名等信息编码生成二维条码,并可实施信息加密; ● DLL产品以结构形式设置条码各参数; ● 提供串口设置及调用函数; ● 通用性强,普遍适合一般串口通信传输。 以动态库(DLL)方式提供人像照片压缩控件,以便用来生成二维条码。 ● 使用先进压缩技术,压缩比高,失真小; ● 压缩后的图片可控制在1K以内;5 193浏览会员免费
- 清华紫光大小:21MB清华紫光手写识别系统之全能王V9.1手写板驱动,适用于清华紫光所有型号手写板清华紫光手写识别系统之全能王V9.1手写板驱动,适用于清华紫光所有型号手写板5 559浏览会员免费
- Data大小:913KB这个工具可以生成Data Matrix\ QR Code两种码制这个工具可以生成Data Matrix\ QR Code两种码制5 2558浏览会员免费
- 会员管理大小:12MB专业的会员管理软件,广泛应用于各种店面的会员管理专业的会员管理软件,广泛应用于各种店面的会员管理4 1093浏览会员免费
- 全屏轮播大小:2MB淘宝专业版店铺装修软件: 全屏轮播代码生成器 自带浏览功能 1.软件提供自由设置长宽功能,图片数量,轻松突破950限制.(全屏效果 绝对居中!) 2.软件提供一键预览功能, 不用拷贝代码到淘宝测来测去,浪费宝贵时间。 3.软件会自动宝贝配置,重新打开软件是您最后一次设计成果。 4.软件支持导入导出功能, 将设计好的效果导出,后续要修改直接导入就好,减少重复工作. 5.软件支持免费升级,让您物超所值!淘宝专业版店铺装修软件: 全屏轮播代码生成器 自带浏览功能 1.软件提供自由设置长宽功能,图片数量,轻松突破950限制.(全屏效果 绝对居中!) 2.软件提供一键预览功能, 不用拷贝代码到淘宝测来测去,浪费宝贵时间。 3.软件会自动宝贝配置,重新打开软件是您最后一次设计成果。 4.软件支持导入导出功能, 将设计好的效果导出,后续要修改直接导入就好,减少重复工作. 5.软件支持免费升级,让您物超所值!4 219浏览会员免费
- pdf转word大小:53MBpdf转成word转换器免费破解版是一款功能强大、操作简单的word文档转换软件,已经成功破解,并附带了注册码,即下即用,能够帮助用户将pdf文件和文件夹轻松转换成word文档。同时该软件界面美观大方,支持单页和多页转换,还可以让用户来设定转换页面范围,是一款非常给力的pdf转换成word转换器。点击“PDF转换器_setup.exe”安装即可。pdf转成word转换器免费破解版是一款功能强大、操作简单的word文档转换软件,已经成功破解,并附带了注册码,即下即用,能够帮助用户将pdf文件和文件夹轻松转换成word文档。同时该软件界面美观大方,支持单页和多页转换,还可以让用户来设定转换页面范围,是一款非常给力的pdf转换成word转换器。点击“PDF转换器_setup.exe”安装即可。4 522浏览会员免费
- PPT大小:41MB本PPT内所有图表为锐普PPT公司图表研究院学员作品,图表均为为矢量可编辑格式,可随意调整颜色和形状,方便实用。更多精彩,尽在锐普专业PPT设计!这里有中国最大的原创PPT素材站,这里有中国最强的PPT制作团队,这里有人人都能快速提升的PPT培训。清晰、美观、创意、有效、超值、保密,我们为数百家客户带来意想不到的价值。本PPT内所有图表为锐普PPT公司图表研究院学员作品,图表均为为矢量可编辑格式,可随意调整颜色和形状,方便实用。更多精彩,尽在锐普专业PPT设计!这里有中国最大的原创PPT素材站,这里有中国最强的PPT制作团队,这里有人人都能快速提升的PPT培训。清晰、美观、创意、有效、超值、保密,我们为数百家客户带来意想不到的价值。5 368浏览会员免费
- rstudio大小:48MB免费分析软件,比r的界面更人性化和可操作化免费分析软件,比r的界面更人性化和可操作化5 1046浏览会员免费
- PDF大小:10MBAnyBizSoft_PDF_Converter 非常好用的PDF转换工具绿色版(带注册码) AnyBizSoft PDF转换器是一个全面的PDF转换工具,它可以帮助您将PDF转换为的Word,PowerPoint,EXCEL,EPUB,HTML和文本。还可以转换需要的页面,只要需要页码就可以了,非常方便使用! 但是扫描成PDF的文件转出来也是图片格式!AnyBizSoft_PDF_Converter 非常好用的PDF转换工具绿色版(带注册码) AnyBizSoft PDF转换器是一个全面的PDF转换工具,它可以帮助您将PDF转换为的Word,PowerPoint,EXCEL,EPUB,HTML和文本。还可以转换需要的页面,只要需要页码就可以了,非常方便使用! 但是扫描成PDF的文件转出来也是图片格式!5 427浏览会员免费
- print2flash大小:12MB用money买的 包可以用,,要成功安装此破解版的关键在于你一定不可以在安装它之前安装print2flash 的试用版, 不然一定是无法破解的用money买的 包可以用,,要成功安装此破解版的关键在于你一定不可以在安装它之前安装print2flash 的试用版, 不然一定是无法破解的4 122浏览会员免费
- 免费软件大小:388KB账号登录工具 微信公众号 多账号批量登录微信公众号工具 微信公众号助手 点退出会自动退出登录的账号 左表选中下一个账号--账号登录工具 微信公众号 多账号批量登录微信公众号工具 微信公众号助手 点退出会自动退出登录的账号 左表选中下一个账号--5 1262浏览会员免费
- 店铺宝贝大小:245KB淘宝店铺宝贝复制专家12.8已注册破解版特别版已经注册的,不用注册机了!淘宝店铺宝贝复制专家12.8已注册破解版特别版已经注册的,不用注册机了!4 288浏览会员免费
- 通达OA2013大小:162KB通达OA 2013 3.5 3.6 报表组件注册 通达OA2013+IM1000用户补丁 破解版下载地址(共收费5分)。本人经过测试绝对能用。那些说不能用的,不知道是什么意思,估计他们装的系统环境有兼容吧。(通达守护服务不知道是干什么的,老是启动不了。不过好像并不影响使用) 1: http://download.csdn.net/detail/xiaohuuzi/5182049 2: http://download.csdn.net/detail/xiaohuuzi/5179605 3: http://download.csdn.net/detail/xiaohuuzi/5179678通达OA 2013 3.5 3.6 报表组件注册 通达OA2013+IM1000用户补丁 破解版下载地址(共收费5分)。本人经过测试绝对能用。那些说不能用的,不知道是什么意思,估计他们装的系统环境有兼容吧。(通达守护服务不知道是干什么的,老是启动不了。不过好像并不影响使用) 1: http://download.csdn.net/detail/xiaohuuzi/5182049 2: http://download.csdn.net/detail/xiaohuuzi/5179605 3: http://download.csdn.net/detail/xiaohuuzi/51796785 132浏览会员免费
- CRM大小:20MB包含: LUOCRM客户关系管理系统 v1.0.rar SugarCRM PHP客户关系管理系统 v6.2.2.rar 思域开源CRM v1.2.rar 悟空CRM系统.rar包含: LUOCRM客户关系管理系统 v1.0.rar SugarCRM PHP客户关系管理系统 v6.2.2.rar 思域开源CRM v1.2.rar 悟空CRM系统.rar3 4030浏览会员免费
- windows 7 无法连接到打印机 (错误 0x0000000d)的解决方法4 2w+浏览会员免费
- Flash大小:29MB专业的Flash相册制作工具,可以帮助你制作出活泼生动的 Flash 幻灯。你可以在几分钟内把你的照片、音乐制作成漂亮的 Flash 幻灯。软件内置多种转换效果和主题模板,支持导入 MP3,WAV 和 WMA 格式的音频文件,支持导出为 Flash 动画,屏幕保护,EXE,超文本格式并支持生成光盘自动运行文件,功能异常强大!在欢乐的日子里,用这个软件做些贺卡或者电子相册给你的亲人、爱人,让他/她们一起分享你的欢乐吧!只需要选择导入的图片,然后选择效果和设置说明文字,片刻之后一个漂亮的动画便诞生了。专业的Flash相册制作工具,可以帮助你制作出活泼生动的 Flash 幻灯。你可以在几分钟内把你的照片、音乐制作成漂亮的 Flash 幻灯。软件内置多种转换效果和主题模板,支持导入 MP3,WAV 和 WMA 格式的音频文件,支持导出为 Flash 动画,屏幕保护,EXE,超文本格式并支持生成光盘自动运行文件,功能异常强大!在欢乐的日子里,用这个软件做些贺卡或者电子相册给你的亲人、爱人,让他/她们一起分享你的欢乐吧!只需要选择导入的图片,然后选择效果和设置说明文字,片刻之后一个漂亮的动画便诞生了。3 152浏览会员免费
- excel实用大小:6MB全名“绝了!Excel可以这样用——数据处理、计算与分析”主要针对新手,有些还是可以借鉴的(不全)全名“绝了!Excel可以这样用——数据处理、计算与分析”主要针对新手,有些还是可以借鉴的(不全)5 290浏览会员免费