没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
问题一模型的建立与求解 数据预处理 利用python对数据文件进行整合。由于数据文件过多,不便于后续的数据分析,本文利用python遍历每一个数据文件,将其整合至一个“.csv”文件,见附件“数据整合.csv”。 缺失值处理。由于需要对数据进行统计分析,而缺失值会导致统计结果出现偏差,故本文删除缺失值,不做插值处理,避免影响统计结果。 基于DSA的BS景点查询 将整理好的数据进行DSA(Data Structure Analysis)分析,由于问题仅要求查询景点的最高评分,即BS值,则有: BS = max{S_1,1,S_1,2...,S_(i,j),...,S_352,100} 其中,S_(i,j)表示第i个城市的第j个景点的得分。
资源推荐
资源详情
资源评论
一、 问题一模型的建立与求解
1.1 数据预处理
(1)利用 python 对数据文件进行整合。由于数据文件过多,不便于后续的
数据分析,本文利用 python 遍历每一个数据文件,将其整合至一个“.csv”文件,
见附件“数据整合.csv”。
(2)缺失值处理。由于需要对数据进行统计分析,而缺失值会导致统计结
果出现偏差,故本文删除缺失值,不做插值处理,避免影响统计结果。
1.2 基于DSA的BS景点查询
将整理好的数据进行 DSA(Data Structure Analysis)分析,由于问题仅要求查
询景点的最高评分,即 BS 值,则有:
𝐵𝑆
=
𝑚𝑎𝑥{
𝑆
1,1
,
𝑆
1,2
...,
𝑆
𝑖
,𝑗
,...,
𝑆
352,100
}
其中,
𝑆
𝑖,𝑗
表示第 i 个城市的第 j 个景点的得分。
图 1 数据统计图
从图 1 中可以看出,最高评分 BS 为 5,且其占比仅次于评分 0 的景点,全
国共有 2563 个景点获得了 BS。
1.3 基于改进简单聚类与Spearman的城市分类与识别
1.3.1 基于改进简单聚类算法的各城市不同分数景点数量统计
针对于研究的具体问题,本文对简单聚类算法进行了改进,不同于一般简单
资源评论
微信公众号:数模0error
- 粉丝: 7122
- 资源: 364
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功