没有合适的资源?快使用搜索试试~ 我知道了~
2021美赛F奖论文中文版-C题
需积分: 5 36 下载量 76 浏览量
2022-09-16
15:57:51
上传
评论 7
收藏 835KB PDF 举报
温馨提示
试读
25页
2021美赛F奖论文中文版-C题
资源推荐
资源详情
资源评论
C
2021
毫米/厘米
汇总表
#2109298
摘要
亚洲大黄蜂(AGH,柑橘树)是世界上最大的大黄蜂物种之一。
AGH原产于因多马拉亚地区,
是各种昆虫的贪婪捕食者,包括蜜蜂。2019年9月19日,在温哥华外发现了一个AGH巢。尽管鸟巢
在现场被摧毁,但一群幸存下来的大黄蜂继续在附近地区游荡,激起了公众的严重焦虑。北美
AGH种群入侵可能破坏生物多样性,威胁公共卫生[8]。因此,遏制AGH的传播是一项紧迫的任务
,其中我们确定了三个重要的目标:估计AGH种群动态,建立一个有效的报告分类系统,形成一
套分配大黄蜂控制人员的策略。
我们通过构建一个具有一组自定义更新规则的强大的元胞自动机(CA)模型来解决第一个问
题。我们首先将华盛顿州及其周边地区划分为2925个区域(或单元格),每个区域的面积范围为
12公里*12公里。为了提高CA的准确性,我们引入了一个指标,捕获AGH繁殖和活跃水平的季节变
化,以及每个细胞对AGH的适宜性测量。然后,这些索引共同确定了CA的更新规则。CA给出的模
拟描述了以下入侵动态: 1)乔治亚海峡将阻止AGH殖民地向西扩散,特别是向温哥华岛扩散;2)
一部分AGH将首先向东移动,然后向南移动,最有可能进入奥卡诺根-韦纳奇国家森林。3)另一组
AGH将接近适宜性指数较高的加拿大边境。从长远来看,CA模拟表明AGH群体主要向国家森林地区
收敛。为了研究我们的模型对初始条件的敏感性,我们扰动了CA的几个关键参数。然后,我们通
过库贝克-莱布勒散度度量计算不同初始化的输出种群分布之间的距离,并在每个时间步长构造
每个细胞区域的AGH种群的95%置信区间。结果表明,我们的CA模型对参数的显著变化不敏感。
民间报告对遏制AGH至关重要。对于文本数据分析,我们应用潜在狄利克雷分配从文本中提取
关键语义。模型输出表明,大多数文本数据与手头的分类任务无关,因此它们对这项调查的价值
不大。对于图像数据分析,我们构建了一个基于预先训练的VGG-11架构和一个SVM分类器的两阶
段图像分类模型。为了处理一个非常不平衡的数据集,我们通过旋转、裁剪和高斯模糊来增强具
有正标签的图像。然后,我们在2019-0919-2020-0515的图像数据上对我们的模型进行训练,并
在2020-0-0515及以后对其进行测试,平均测试精度为90.2%,AUROC得分为94。4%.该模型在对抗
性攻击下的鲁棒性。对于区域信息,我们设计了一种在空间和时间上的区域报告可信度的度量,
这在接下来的贝叶斯分析中是至关重要的。然后,我们将获得的量的微调版本输入一个朴素贝叶
斯推理模型,该模型输出给定报告的正确分类的可能性,因此可以用于报告处理的优先级。
为了进一步改进我们的模型,我们为传入的报告设计了一个可靠的更新例程。我们从Baum-
Welch算法中得到了深入的了解,并提出了一种新的贝叶斯更新方法。该方法利用蒙特卡罗抽样
法计算不同参数集的后验概率,可以从正报告和负报告中提取信息。
最后,基于CA的预测和更新程序,我们提出了一套规则来决定AGH是否被根除。我们还给华盛
顿州农业部写了一份备忘录,解决了AGH入侵的严重程度,并为检测AGH殖民地和处理目击报告提
供了建议。
关键词:细胞自动机,朴素贝叶斯推理,鲍姆-韦尔奇算法,AUROC分数
选择的问题
团队控制编号
团队#2109298
内容
1、简介、3
1.1.对该问题的重述.............................................................................................................................................3
1.2我们的方法
.............................................................................................................................................
4
2全局假设4
3数据探索4
3.1数据清理
...........................................................................................................................................
4
3.2文本数据
..................................................................................................................................................
4
3.3地理数据
..................................................................................................................................................
6
4基于细胞自动机的AGH传播6
4.1.定义元胞自动机模型.................................................................................................................................... 6
4. 1.1.CA的介绍和动机
...................................................................................................................
6
4..21单元格设置
..........................................................................................................................
6
4.1.3更新规则
....................................................................................................................................
8
4.1.4参数设置...........................................................................................................................................10
.24结果及分析.....................................................................................................................................................10
.34.CA的敏感性分析
.................................................................................................................................
12
5.错误分类的识别13
5.1.基于朴素贝叶斯推理的攻击计划...............................................................................................................14
5. 2第二部分:图像识别(估算P(H|I))..................................................................................................... 16
5.2.1.数据扩充和模型构建................................................................................................................... 16
5.2.2培训和测试结果..............................................................................................................................17
.2.35估计P(H|I)................................................................................................................................. 18
.35估计q...............................................................................................................................................................18
5.4结果及分析
............................................................................................................................................
19
6进一步的改进21
6.1 Baum-Welch更新为CA...................................................................................................................................21
.26根除的证据
...........................................................................................................................................
22
7优缺点22
8个结论23
9备忘录24
第3页共25页
团队#2109298
1介绍
1.1对该问题的重述
柑橘树,通常被称为亚洲巨型大黄蜂(AGH),原产于温带和热带的东亚[2],被广泛认为是一种
凶猛的蜜蜂捕食者。2019年9月,在温哥华和后来的华盛顿州都发现了一个AGH之巢,引发了平民
的严重焦虑。为了防止AGH对当地的农业和经济造成严重破坏,有必要追踪AGH人口的动态。目前
,州政府官员已经收集了一套公开目击AGH的报告数据集。这是我们探索的起点,其中我们需要
满足以下要求:
一个预测AGH在华盛顿州传播的模型。
通过将正确的分类与错误的分类分开,一种帮助解释公共报告的模型。
一种根据给定特定报告时找到真实AGH的概率来优先考虑报告调查的策略。
一种定期更新我们的模型的方法和一种表明华盛顿州AGH人口的标准。
图1:模型框架
第4页共25页
团队#2109298
1.2我们的方法
我们提出了一个如图1所示的模型框架,由两个主要组件组成,元胞自动机(CA)模型和朴素贝
叶斯模型,并有几个过程将给定的数据集准备为主模型的输入。细胞自动机模拟了AGH群体的动
态,而朴素贝叶斯推理结合了三个量:细胞自动机的输出分布,公共报告频率的空间和时间分布
的估计,以及基于伴随图像数据的真实AGH报告的可能性。后一种程序允许我们为每一份报告提
供一个分数,这就形成了我们为报告调查分配资源的策略。作为对该框架的改进,我们还引入了
Baum-Welch算法,以根据每个新的观测结果定期更新CA。这将导致由CA给出的更稳健的估计。
2全球假设
在本节中,我们将介绍以下全局假设;特定于每个模型的假设将在其相应的模型介绍和设置中进
行说明和证明。
假设1.我们假设每个AGH个体都是相同的,而不顾工蜂、蜂后和无人机之间的实际差异。
假设2我们假设华盛顿州的所有AGH都是由2019年9月在温哥华发现的第一个殖民地的完美所引入
的。
假设3,我们假设AGH能够探索其周围的环境,并倾向于停留在一个合适的位置。
假设4:我们假设每个单元格内的所有地理特征和人类足迹都是一致的(在第4.1.2节中定义的地
理区域)。
假设5,我们假设AGH和其他蜜蜂的繁殖率和活动率都是季节性的;每年的趋势都是相同的。
3数据探索
3.1数据清理
检查数据文件(2021MCMProblemC_DataSet.xlsx,2021MCMProblemC_Images_by_Global ID。xlsx
,2021MCM_ProblemC_Files.rar),我们发现该数据集包含所有的数字、文本和可视化数据。我们
根据全局ID合并了两个excel表;然后,我们剔除了异常值和异常值,包括2019年9月之前的138份
公开报告,因为我们只关注第一起积极事件后的情况。我们还删除了使用“*”以外的数据类型提
交的图像。jpg”,因为它们很难作为图片处理,它们的数量微不足道。一些报告
有多达11张图片,而有些则没有。我们保留这两种报告,并在第5节中进行不同的处理。
3.2文本数据
为了获得对文本数据的统计洞察,我们首先对其进行预处理。我们从数据帧中提取“注释”和“
实验室注释”列,并删除具有空值的行
剩余24页未读,继续阅读
资源评论
cynara12
- 粉丝: 8
- 资源: 12
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功