"卷积神经网络在语言识别中的应用——以江苏省方言分类为例" 卷积神经网络(Convolutional Neural Networks,CNN)是一种人工智能神经网络,应用于语言识别领域,特别是在江苏省方言分类中。卷积神经网络的起源可以追溯到1980年,Fukushima 提出了基于感受野的理论模型 Neocognitron,并发展了自组织的多层神经网络模型。1998年,Lecun 等提出了 LeNet-5,采用反向传播算法对神经网络进行有监督的训练,实现了图像分类。 卷积神经网络的结构主要由多个独立的神经元彼此连接构成平面,形成了多个二维平面构成完整的网络。卷积神经网络一般含有多个卷积层与特征映射层,其中卷积层是卷积神经网络最基本的结构,包括数据输入、卷积计算、激活、池化等部分组成。卷积计算的目的是通过卷积核与输入数据的卷积来实现图像的特征提取,得到多个特征映射。 本研究中,卷积神经网络用于江苏省方言分类,提出了一种高效准确的语音识别与分类的方法,建立了详细的方言数据库。在语音文件的准备过程中,本研究选择了种类繁多、发音相近的江苏省方言对神经网络进行训练,按照江苏省各市分为 70 类,每类的语音文件又分为单字、词语和短句各选择 300 个音频文件,从而提供了足够可分为训练集与测试集的数据库。 在卷积神经网络的结构中,卷积层通过最大池化来提取图像有效特征,防止过拟合,同时提高模型泛化能力;特征映射层通过 ReLu 函数来约束 Logistic 回归中可能出现的负值,最后一层通过 softmax 来输出分类结果。 卷积神经网络的特点与优势在于其权值共享的结构类似于生物神经网络,使得网络模型的复杂度大大降低而被用于图像及语音的识别,并取得了卓越的效果。另外,由于引入了 GPU,以前的复杂模型现在通过并行计算能很容易地训练,大大缩短了训练调节参数的周期,大大增强了卷积神经网络的实用性。 卷积神经网络在语言识别中的应用,特别是在江苏省方言分类中,具有很高的价值和实用性,为保护和研究方言提供了重要的技术支持。
- 粉丝: 133
- 资源: 23万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助