1
2024 年 MathorCup 数学应用挑战赛——大数
据竞赛
赛道 A:台风的分类与预测
台风属于热带气旋,是与人类生活和生产关系密切的降雨系统。然而, 台风容易造成多种
灾害,例如:狂风、暴雨、风暴潮、泥石流、生态破坏、 疫病流行等,具有突发性强、破
坏力大的特点,成为世界上最严重的自然 灾害之一。
台风的成因,至今仍无法准确确定,仅已知它是由热带大气内的扰动 发展而来的。在
热带海洋上,海面因受太阳直射而使海水温度升高,海水 容易蒸发成水汽散布在空中,
造成热带海洋上的空气温度高、湿度大。这 种空气因温度高而膨胀,致使密度减小,质量
减轻,而赤道附近风力微弱, 所以很容易上升,发生对流作用,同时周围冷空气流入补
充,然后再上升, 如此循环不已,使得整个气柱皆为温度较高、重量较轻、密度较小之空
气, 形成了“气旋”(低气压)。
图 1 台风示意图
由于形成台风的影响因素众多,使得台风运动轨迹极其复杂,运动轨 迹和影响因素之
间呈现高度非线性。其中,台风的移动主要靠两种力:一 种是内力,另一种是外力。内
力是台风本身所产生的力。北半球台风是一 团反时针方向旋转着的空气,在旋转时,
空气质点的移动方向,要受到地 球自转的影响而发生偏向。这种偏向往往是台风向高
纬度的一侧比向赤道
2
的一侧来得大,促使台风向北移动,即为内力。另外,夏秋之际,太平洋 上常有一个独
立的高气压(副热带高气压),这个高气压四周的风向对台风 的移动路径具有直接的影响。
台风发生在副热带高压的南部边缘,会形成 东风,使台风向西行,即为外力。如果副
热带高气压西伸并加强,台风路 径就在偏南地方向西行进;如果副热带高气压在台风
北方东退或断裂,台 风就可能在高压的西缘或裂口处转向北行,当绕到高压西北边缘,
在西南 风影响下,就向东北方向前进。另外,台风的路径有时还会受到其他台风 的影
响,出现打转、停滞的现象(例如:双台风或多台风相互影响)。
请结合大数据分析的方法完成以下问题: 初赛问题
问题 1:分析台风特征参数(强度、等级、风速等)与气温、气压、季 风的关系,依据气
温、气压、季风等因素的影响,建立台风的分类评价模 型,明确类别划分的标准或评
价算法,进行不同特征的台风类别划分。夏 台风生成于 6-8 月,秋台风 9-11 月,根据所
建立的分类评价模型,以 2024
年我国 7 月和 9 月为例,给出台风类别及途经省份的列表,并分析夏台风 与秋台风的
区别。
表 1 :2024 年我国 7 月和 9 月台风类别及途经省份
月份
台风类别
途经省份
7 月
夏台风
9 月
秋台风
注:表格仅做示意,可根据情况修改增减。
问题 2:除温度、气压、季风外,台风的路径还受地球自转偏向力等多
3
重因素影响。根据气温、气压、洋流、风场等多种因素,建立台风路径预 测的模型。并
且,以 2024 年 9 月 13 日-17 日每日 14 点的第 13 号台风贝碧 嘉为例,预测行进路线,运
用 Dynamic Time Warping(DTW)动态时间规整算 法与台风实际行进路线进行对比。
表 2: 2024 年 9 月 13 日-17 日每日 14 点的第 13 号台风贝碧嘉的中心位置
时间
台风中心位置
(经度/纬度)
13 日 14:00
14 日 14:00
15 日 14:00
16 日 14:00
17 日 14:00
注:预测结果填到表 2 中,并放于论文正文。
问题 3 :台风登陆后,风速和雨量将逐渐减弱,且某地区受台风影响 而产生的风速和
降水量,随着其与台风中心距离的增加而减小。请建立台 风在登陆后的行进过程中降
水量及风速的关系,及降水量与距台风中心距 离的关系。并且,以 2024 年 9 月 16 日-18
日的第 13 号台风贝碧嘉为例,根 据所建立的模型,预测贝碧嘉行进途中的中心风力及降
水量,进行分析。
数据说明:
附件 1:中国近海台风路径集合(1945-2023).zip;
其他可参考数据:
数据不限于提供的数据,参赛者可根据需要自行查找其他数
据,请注明数据来源。 以下参考数据已经下载见百度网盘:
链接: https://pan.baidu.com/s/1JZ_163qGoIDQkKqcDvT4Pw?pwd=8394
提取码: 8394 数据来源
网址: 海洋科学大数据
中心:
https://msdc.qdio.ac.cn/data/metadata-special-detail?id=1422759994058625025
4
北半球气压数据(1899-至今),数据来源:https://rda.ucar.edu/datasets/d010000/dataaccess/
1929-2024 年全球站点的逐日平均风速数据(ShpExcel12000 个站点)数据来源:
https://www.ncei.noaa.gov/data/global-summary-of-the-day/archive/
海洋气温数据(1991- 至今) :
https://psl.noaa.gov/data/gridded/data.ncep.reanalysis.html
海洋温度数据:
http://www.ocean.iap.ac.cn/pages/dataService/dataService.html?navAnchor=dataService
海洋表面温度数据、海洋温度数据(air.2m.gauss)、CHM_PRE_0.1dg_19612022(降水量
场)数据压缩包,为气象数据常用的 netcdf4 形式存储的 nc 数据文件,可以利用 python
库 netcdf4、xarray 或者 pandas 进行数据处理。 降水
量数据集:https://tcdata.typhoon.org.cn/rdqxfy.html 中
国逐日降水数据集(1961-2022):
https://www.tpdc.ac.cn/zh-hans/data/e5c335d9-cbb9-48a6-ba35-d67dd614bb8c
其他: 欧洲哥白尼海洋中心数据:
https://cds.climate.copernicus.eu/#!/home
ERA5 :
https://cds.climate.copernicus.eu/datasets
第 5 页 共 32 页
目录
1 问题综述 .................................................................................................................................. 6
1.1 问题背景 .......................................................................................................................... 6
1.2 问题提出 .......................................................................................................................... 7
2 问题分析 .................................................................................................................................. 7
2.1 问题 1 分析 ...................................................................................................................... 7
2.2 问题 2 分析 ...................................................................................................................... 7
2.3 问题 3 分析 ...................................................................................................................... 7
3 模型假设与符号说明 .............................................................................................................. 8
3.1 模型假设 .......................................................................................................................... 8
3.2 符号说明 .......................................................................................................................... 8
4 数据预处理 .............................................................................................................................. 8
5 问题 1 模型的建立和解答 ...................................................................................................... 9
5.1 台风的分类评价模型 ..................................................................................................... 10
5.2 随机森林趋势检测模型 ................................................................................................. 11
5.2.1 随机森林模型建立 ................................................................................................... 11
5.2.2 基于随机森林的前兆特征信号区间识别模型 ......................................................... 12
5.3 模型的解答 .................................................................................................................... 13
5.4 模型的结论 .................................................................................................................... 15
6 问题 2 模型的建立和解答 .................................................................................................... 16
6.1 台风路径预测模型 .......................................................................................................... 16
6.2 LSTM 长短期记忆网络预测模型 .................................................................................... 17
6.3 DTW 动态时间规整算法 .................................................................................................. 19
6.4 模型的解答 .................................................................................................................... 23
6.5 结论 ................................................................................................................................ 24
7 问题 3 模型的建立和解答 .................................................................................................... 24
7.1 标准化降水指数模型 ..................................................................................................... 24
7.2 GA-LSTM 神经网络模型 .................................................................................................. 26
7.3 模型训练和解答 ............................................................................................................. 29
7.3.1 模型的测试与预测 ................................................................................................. 29
7.4 总结 ................................................................................................................................ 30
8 模型的评价 ............................................................................................................................. 32
8.1 模型的优点 .................................................................................................................... 32
8.1 模型的缺点 .................................................................................................................... 32
参考文献 .................................................................................................................................... 33
附录 ........................................................................................................................................... 34