统计软件及应用课程设计
-----虫情危害预测
学 院:
班 级:
学 号:
姓 名:
指导老师:
精选文档
— 1
目录
一.背景与意义 .................................................................................................... 2
二.问题重述 ......................................................................................................... 2
三.方法简介 ......................................................................................................... 2
( 一). 判别分析 ................................................................................................ 2
( 二).BP 神经网络 ........................................................................................... 3
四.数据处理与分析 ............................................................................................. 3
( 一). 数据预处理 ............................................................................................ 4
( 二). 判别分析 ................................................................................................ 4
1. 模型建立 ............................................................................................... 4
2. 模型优化 ............................................................................................... 6
3. 模型应用 ............................................................................................... 7
( 三).BP 神经网络 ........................................................................................... 7
1. 模型建立 ............................................................................................... 7
2. 模型优化 ............................................................................................... 8
3. 建模重建 ............................................................................................. 10
4. 模型应用 ............................................................................................. 11
五.总结与建议 ................................................................................................... 12
精选文档
— 2
一. 背景与意义
农作物主要害虫常年对农作物造成严重危害, 使农业经济遭到损失。 预测害
虫未来的发生动态,可以使治虫工作得以有目的、有计划、有重点的进行。害虫
的预测预报工作是进行害虫综合防治的必要前提。 只有对害虫发生危害的预测预
报做到及时、准确,才能正确的拟定综合防治计划,及时采取必要的措施,经济
有效的压低害虫的发生数量,保证农业的高产、稳产。
二. 问题重述
本文选取的预测预报对象是安徽庐江的田间水稻。 水稻螟虫是水稻的重要害
虫之一,对农作物的危害极大 ,其数量的多少一定程度上决定着水稻受危害的 严
重程度。通过对此昆虫的基本了解, 发现气候因素对昆虫的发生发展有着密切关
系,可以直接影响昆虫的生长、 发育、生存、繁殖,从而造成害虫不同的发生期、
发生量和危害程度。 同时水稻螟虫是变温昆虫, 其生长、 发育和繁殖与气象条件
的关系极为密切,所以我们从气候因素角度入手进行分析是合理的。
本文从影响害虫生存繁殖的气候因素角度入手, 结合往年的气象资料以及影
响害虫生存繁殖的重要气候因素, 选取了平均气温、 最低气温、 日照时间及降雨
量四个主要影响因素, 运用统计学方法确定虫害的发生量与气候因子的关系, 并
给出相应的预测方法。
三. 方法简介
针对实际问题, 我们需要通过对历史数据的分析, 给出准则: 当给定新时期
下每一样本对应的各项气候指标时, 能准确的判断其对应的虫害程度。 下面介绍
两种方法。
( 一). 判别分析
判别分析是在分类确定的条件下, 根据某一研究对象的各种特征值判别其类
型归属问题的一种多变量统计分析方法, 是用以判别个体所属群体的一种统计方
法。根据判别中的组数, 可以分为两组判别分析和多组判别分析; 根据判别函数
的形式,可以分为线性判别和非线性判别; 根据判别式处理变量的方法不同, 可
以分为逐步判别、序贯判别;根据判别标准不同,可以分为距离判别、 Fisher
判别、 Bayes 判别法。
本文选用的是 Fisher 判别法。 Fisher 判别,是根据线性 Fisher 函数值进
行判别,使用此准则要求各组变量的均值有显著性差异。 该方法的基本思想是投
影,即将原来在 R维空间的自变量组合投影到维度较低的 D维空间去,然后在 D
维空间中再进行分类。 投影的原则是使得每一类的差异尽可能小, 而不同类间投
影的离差尽可能大。 Fisher 判别的优势在于对分布、方差等都没有任何限制,
应用范围比较广。 另外,用该判别方法建立的判别方差可以直接用手工计算的方
法进行新样品的判别,这在许多时候是非常方便的。
精选文档
— 3
( 二).BP 神经网络
BP神经网络是 1986 年由 Rumelhart 和 McCelland 为首的科学家小组提出,
是一种按误差逆传播算法训练的多层前馈网络, 是目前应用最广泛的神经网络模
型之一。 BP网络能学习和存贮大量的输入 - 输出模式映射关系,而无需事前揭示
描述这种映射关系的数学方程。 它的学习规则是使用梯度下降法, 通过反向传播
来不断调整网络的权值和阈值,使网络的误差平方和最小。 BP神经网络模型拓
扑结构包括输入层、隐藏层和输出层。
BP神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层
各神经元负责接收来自外界的输入信息, 并传递给中间层各神经元; 中间层是内
部信息处理层, 负责信息变换, 根据信息变化能力的需求, 中间层可以设计为单
隐层或者多隐层结构; 最后一个隐层传递到输出层各神经元的信息, 经进一步处
理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。
当实际输出与期望输出不符时, 进入误差的反向传播阶段。 误差通过输出层, 按
误差梯度下降的方式修正各层权值, 向隐层、 输入层逐层反传。 周而复始的信息
正向传播和误差反向传播过程, 是各层权值不断调整的过程, 也是神经网络学习
训练的过程, 此过程一直进行到网络输出的误差减少到可以接受的程度, 或者预
先设定的学习次数为止。
本文运用的是单层前馈网络模型,一般称为三层前馈网或三层感知器,即:
输入层、中间层(也称隐层)和输出层。如下图所示它的特点是:各层神经元仅
与相邻层神经元之间相互全连接, 同层内神经元之间无连接, 各层神经元之间无
反馈连接,构成具有层次结构的前馈型神经网络系统。
四. 数据处理与分析
数据来自于 1980~1988 年 6~10 月安徽庐江的月平均温度、月最低温度、
月日照时间、 月降雨量以及水稻的月平均虫害程度, 且数据都是经过标准化之后
的。