二层前传神经网络中在线梯度法的收敛性(2001年)

需积分: 9 55 浏览量 2021-05-24 05:17:07 上传评论收藏 324KB PDF 举报

文章《二层前传神经网络中在线梯度法的收敛性》主要探讨了在线梯度法（Online Gradient Method，OGM）在二层前传神经网络中的收敛性问题。本文对在线梯度法的一般情况进行分析，并将理论应用于一些常用的激活函数和能量函数，扩展了之前仅限于平方误差函数的收敛性定理。文章提到了在线梯度法源自传统的梯度下降法。这种方法类似于用于求解线性方程组的Gauss-Seidel方法，其特点是可以在当前步骤立即应用前一步的结果进行学习过程的计算。由于在线梯度法速度快、经济且效率高，在工程界备受青睐，并且在神经网络的计算问题中得到了广泛的应用。然而，关于在线梯度法在非线性情况下的收敛性，尤其是在给定一组有限训练样本时，并没有很多已知的信息。在非线性情况下，有关在线梯度法的收敛性在之前的研究中针对特殊的误差函数（比如平方误差函数）给出了定理。本文则将这些结果推广到更一般的误差函数上，并得到了相应的收敛性结果。文章的结构安排如下：在第二部分，作者引入了预备知识，提出了几个引理，并基于这些引理证明了三个定理。这些结果是证明收敛性定理的关键。在第三部分，给出了弱收敛定理、强收敛定理以及收敛速度定理。在第四部分，讨论了本文假设与之前研究假设之间的差异，并列举了一些常用的激活函数和能量函数。对于在线梯度法，其核心思想是利用已有的计算结果，不断更新模型的参数，以期在每次迭代中减少损失函数的值，进而逼近全局最优解。在线梯度法在神经网络中的应用中，参数更新策略遵循梯度下降法的基本原则，即沿着目标函数负梯度的方向进行参数更新。由于在线梯度法直接使用当前样本的数据来更新参数，因此相较于传统的梯度下降法（批量梯度下降法）具有以下特点：它不需要存储所有的训练数据，节省内存空间；可以实现实时学习，提高训练速度；对异常值或噪声数据具有较好的适应性。在文中，作者提出了多个引理和定理以支持在线梯度法在二层前传神经网络中的收敛性分析。例如，一个弱收敛定理可能涉及到参数更新序列的极限性质，而强收敛定理可能要求参数更新序列不仅收敛而且收敛到最优解附近。这些理论的建立是为了证明在线梯度法能够以一定的概率找到全局最优解，或者至少是局部最优解。此外，对于收敛速度的讨论可能包含了对收敛速率的具体描述，比如参数更新序列逼近最优解的速度，这对于实际应用中算法调优和确定训练轮数具有指导意义。激活函数在神经网络中起着至关重要的作用，它决定了网络的非线性映射能力。常见的激活函数包括Sigmoid、双曲正切（tanh）和ReLU（Rectified Linear Unit）等。在线梯度法的收敛性分析往往会考虑这些激活函数的特性，因为它们在神经网络的前向传播和反向传播中都扮演着重要角色。此外，能量函数描述了神经网络的损失或代价，它是模型训练过程中优化的目标，其定义的性质同样会影响在线梯度法的收敛性。文章通过理论分析，将在线梯度法在二层前传神经网络中的应用推广至更一般的情况，并为该算法在实际问题中的稳定性和有效性提供了理论基础。这些研究不仅丰富了在线学习理论，也为设计和应用神经网络提供了重要的指导。

资源推荐

资源详情

资源评论

Journal

Mathematical

Research

& Exposition

No.2

219-228

May

2001

Convergence

On-Line

Gradient

Methods

for

Two-Layer

Feedforward

eural

etworks

Zheng-

Wet

'2,

ZHANG

Hong-wei

(1.

Dept. of Math., Jilin University, Changchun 130023, Chinaj

Dept. of Math.,

Dali

皿

University

of Technology, Dalian 116024, China)

Abstract:

A discussion

given on the convergence of the on-line gradient methods

for

twφlayer

feedforward neural networks

general cases. The theories are applied to some

usual activation functions and energy functions.

Key

words:

on-line gradient methodj feedforward neural networkj convergence.

Classification:

AMS(1991) 68TOljCLC TP183

Document

code:

Article

ID:

lOOO-341X(2001)02-0219-

Introduction

The

on~line

gradient

method

(OGM)

originates

from

the

阳

epest

descent

method.

simil

町

the

Gauss-Seidel

method

for solving

linear

equations

that

the

proceeding

results

町

applied

immediately

the

computation

the

present

step

learrung

pro-

cedure.

Due

its

rapidity

economy

and

high

efficiency,

出

been

the

good

graces

engineering

community

and

has

found

a wide

application

the

computation

problems

neural

networks.

However,

the

nonlin~ar

case,

not

very

much

known

about

the

convergence

OGM

for a given set

finite

出

ning

缸

nples.

Convergence

theorems

OGM

町

given

[1]

for a special

error

function

the

squ

町

error

function.

This

pap

臼

generalizes

the

results

[1]

general

cases

and

obtains

corresponding

convergence

results.

This

paper

arranged

部

follows.

Section

2 we

introduce

some

prelimin

町

knowl-

edge

pose

some

lemmas

and

prove

three

theorems

based

the

lemmas.

These

results

町

essential

prove

the

convergence

theorems.

A weak convergence

theorem

, a

strong

convergence

theorem

and

theorem

the

rate

convergence

缸

given

Section

4thephtionsMp

betwm

the

assumptions

tMs

pap

町

and

those

[1]

discussed

臼

some

usual

activation

functions

缸

energy

functions

are

listed.

*Received date:

1999-12-27

Foundation

item: Supported

the Natural

Science

Foundation

China

Biography:

Zheng-xue

(1962-

male

, born

Heilongjiang

province

, associate professor.

E-mail:

Lzxue

( student.dlut.edu.cn

剩余9页未读，继续阅读

评论收藏

内容反馈

weixin_38690402

粉丝: 5
资源: 1007

二层前传神经网络中在线梯度法的收敛性 (2001年)

最新资源

二层前传神经网络中在线梯度法的收敛性 (2001年)

带惩罚项与随机输人的BP神经网络在线梯度学习算法的收敛性 (2007年)

基于双向LSTM神经网络模型的中文分词.pdf

基于大数据的5G前传网络质量分析方法.pdf

华为5G 前传3.0技术白皮书

TSN与移动网络前传架构融合研究2021最新.pdf

5G前传3.0技术白皮书.pdf

OTIC开放前传接口技术要求-Option7转Option8-管理面20210423.docx

5G前传中，移动及联通使用的方案是什么？

网络游戏-无线网状网络中的回程和前传通信.zip

xWDM方案在5G前传中的对比分析

OTIC开放前传接口管理面技术要求-Option7-2分册-v00.20.pdf

网络优化无线前传项目报告.docx

基于大数据的5G前传网络质量分析方法.zip

Imagination发布PowerVR NNA神经网络加速器 (2).pdf

Python(NetOps)前传-网络设备开局配置

5G前传波分技术方案有哪些？

PON用于5G前传案例

5G前传波分复用方案解析

基于光纤传送网的5G移动通信前传关.pdf

行业-TSN与移动网络前传架构融合研究2021最新.rar

5G前传光模块优选WDM，节约光纤用量

5G前传光模块解决方案对比

重新设计下一代网络的前传：超越基带样本和点对点链接

华为5G 前传3.0技术白皮书.pdf

【华为】5G前传3.0技术白皮书.pdf

中国电信面向5G前传的无源彩光粗波分复用设备技术要求.pdf

最新资源