没有合适的资源?快使用搜索试试~ 我知道了~
《金融数据分析(技能基础)》期末考核试卷及答案.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 96 浏览量
2022-10-14
12:34:54
上传
评论
收藏 1.87MB DOCX 举报
温馨提示
试读
14页
《金融数据分析(技能基础)》期末考核试卷及答案.docx《金融数据分析(技能基础)》期末考核试卷及答案.docx
资源推荐
资源详情
资源评论
企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,
而且有效地保证了调查数据真实性,缩短了调查的周期。因此 APP 成为该平台运行的
核心,而 APP 中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问
津,而导致商品检查的失败。
*****学院课程考核试卷
(2018—2019 学年度第一学期)
附件一是一个已结束项目的任务数据,包含了每个任务的位置、定价和完成情况
(“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信
誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先
开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配
发)。附件一和附件二的表结构如表1 和表2 所示。
《
金融数据分析(技能基础)
》课程(A /B 卷)
√
课程代码
考试班级
考核形式
机试
表 1 附件一:已结束项目任务数据
考核日期
20 年 月 日
考核时长
分钟
任务号码
A0001
A0002
A0003
A0004
A0005
A0006
A0007
A0008
……
任务 gps 纬度
22.56614225
22.68620526
22.57651183
22.56484081
22.55888775
22.55899906
22.54900371
22.56277351
……
任务 gps 经度
113.9808368
113.9405252
113.957198
114.2445711
113.9507227
114.2413174
113.9722597
113.9565735
……
任务标价
66
任务执行情况
0
命题教师签名
主管学院领导签名
教研室主任签名
65.5
65.5
75
0
1
0
65.5
75
0
题 号
分 值
实得分
统分人
一
二
三
四
五
六
总分
100
0
20
30
14
16
20
65.5
65.5
……
1
0
……
核分人
表 2 附件二:会员信息数据
预订任务 预订任务开
作答说明:1.将程序拷贝到对应题目下面,并将运行结果(部分)截图放在程序后面。
2.另建一个文件夹,命名:答题程序,存放每题程序及数据文件,最后压缩。
3.将 1 和 2 的文件压缩,命名:学号(完整)+姓名,并提交。
会员编号 会员位置(GPS)
限额
114
163
139
98
始时间
6:30:00
6:30:00
6:30:00
6:30:00
……
信誉值
B0001
B0002
B0003
B0004
……
22.947097 113.679983
67997.3868
37926.5416
27953.0363
25085.6986
……
22.577792 113.966524
23.192458 113.347272
23.255965 113.31875
……
得分
评卷人
一、程序计算综合应用题(本大题共 1 小题,每小题 20 分,
共 20 分)
……
“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载 APP,注册成为
APP 的会员,然后从APP 上领取需要拍照的任务(比如上超市去检查某种商品的上架情
况),赚取APP 对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台,为
建一个 Python 脚本文件,命名为 test1.py,完成以下任务:
1)计算 A0001、A0002 任务位置到所有会员位置的距离,结果采用两个序列来保存,
分别记为 S_A0001、S_A0002,其中 index 为会员编号,值为其对应的距离。(10 分)
2) 计算 A0001 任务在 5 公里范围内的会员个数,记为 A0001_Bnum。(5 分)
3) 计算 A0002 任务在 5 公里范围内所有会员信誉值总和,记为 A0002_Bavg。(5 分)
得分
评卷人
三、主成分、聚类模型基础应用题(本大题共 1 小题,每
小题 14 分,共 14 分)
附注:设定 A 点(纬度 ,经度 )和 B 点(纬度 ,经度 ),则两点之间的距
1
1
2
2
离
可以用以下公式进行计算:
今有我国各地区普通高等教育发展状况数据,具体见《高教数据.xlsx》,其中 x1 为每百
万人口高等院校数;x2 为每十万人口高等院校毕业生数;x3 为每十万人口高等院校招
生数;x4 为每十万人口高等院校在校生数;x5 为每十万人口高等院校教职工数;x6 为
每十万人口高等院校专职教师数;x7 为高级职称占专职教师比例;x8 为平均每所高等
院校的在校生数;x9 为国家财政预算内普通高教经费占国内生产总值比重;x10 为生均
教育经费)。
1
2
2 2
1
COS
1
2
111.199
2
2
1
2
2
其中距离的单位为:公里。
建一个 Python 脚本文件,命名为 test3.py,完成以下任务:
得分
评卷人
二、分类模型基础应用题(本大题共 1 小题,每小题 30 分,
共 30 分)
1) 对以上指标数据做主成分分析,并提取其主成分,要求累计贡献率达到 90%以上。
(7 分)
2) 基于提取的主成分,对以上 30 个地区做 K-均值聚类分析(K=4),并将地区名称和
所属的类别在命令窗口中输出聚类结果。(7 分)
1. 今有某银行的贷款审批数据,采集的特征一共有 15 个,依次为 x1~x15。决策变
量为 y,取值为 1(同意贷款)和 0(不同意贷款),数据共 690 条记录,具体见文件
《银行贷款审批数据.xlsx》。
建一个 Python 脚本文件,命名为 test2.py,完成以下任务:
得分
评卷人
四、关联规则算法基础应用题(本大题共 1 小题,每小题
16 分,共 16 分)
1)特征数据 x1~x15 存在缺失数据,其中 x1~x6 为数值变量,x7~x15 为名义变量。
请对 x1~x6 中存在的缺失值用均值策略填充,x7~x15 用中位数策略填充。(10 分)
2)对 x1~x6 变量数据作均值-方差标准化处理,需要注意的是x7~x15 名义变量不需
要作标准化处理。(5 分)
假设有以下数据集,每行代表一个顾客在超市的购买记录:
I1: 西红柿、排骨、鸡蛋、毛巾、水果刀
I2: 西红柿、茄子、水果刀、香蕉
3)将经过前面两步处理后的数据集,取前 600 条记录作为训练数据,后 90 条记录
作为测试数据,利用支持向量机、逻辑回归、神经网络三种不同的模型依次做出预
测,并计算其预测精度。(15 分)
I3: 鸡蛋、袜子、毛巾、肥皂、水果刀
I4: 西红柿、排骨、茄子、毛巾、水果刀
I5: 西红柿、排骨、酸奶
4)将预测精度通过柱状图表示出来,其中横轴为模型名称(支持向量机、逻辑回归、
神经网络),纵轴为其对应的预测精度。(5 分)
I6: 鸡蛋、茄子、酸奶、肥皂、香蕉
I7: 排骨、鸡蛋、茄子、水果刀
I8: 土豆、鸡蛋、袜子、香蕉、水果刀
I9: 西红柿、排骨、鞋子、土豆、香蕉
建一个 Python 脚本,命名为 test4.py,完成以下任务:
A4(最高价 / 均价):最高价 / 过去 10 个交易日的移动均平均收盘价
A5(最低价 / 均价):最低价 / 过去 10 个交易日的移动平均收盘价
A6(极差):最高价 - 最低价(衡量波动性)
1) 将以上购买记录转换为布尔类型数据,其数据结构为DataFrame(10 分)
2) 利用 Apriori 关联规则挖掘算法函数进行关联规则挖掘,最小支持度和最小置信度
分别为 0.2 和 0.4,并将挖掘结果导出到 Excel 表格中(6 分)
A7(瞬时收益):收盘价 - 开盘价
Y(决策变量):后交易日收盘价 - 当前交易日收盘价,如果大于 0,记为 1;如果小
于等于 0,记为 -1。
同时对指标 A1~A7 作标准化处理:( 当前值 - 均值 )/ 标准差,最终得到以下标准的数
据结构形式:
得分
评卷人
五、综合应用案例分析题(本大题共 1 小题,每小题 20 分,
共 20 分)
ID
1
A1
A2
A3
A4
A5
A6
A7
Y
2
今有沪深 300 指数 2014 年的交易数据,其数据结构表 3 所示。
表 3 沪深 300 指数 2014 年交易数据
3
4
5
Indexcd Idxtrd01
Idxtrd02 Idxtrd03 Idxtrd04 Idxtrd05 Idxtrd06
6
000300
000300
000300
000300
000300
000300
000300
000300
000300
000300
……
2014-01-02 2323.43 2325.99 2310.65 2321.98 451942.9
……(10 分)
2014-01-03 2311.97 2314.84 2280.89 2290.78 597826.5
2014-01-06 2286.37 2286.37 2229.33 2238.64 663004
2)取后 30 条记录作为测试样本,剩下的数据记录为训练样本,利用支持向量机模型
进行训练及测试,获得模型的准确率和预测准确率,分别记为 score 和 Rv,并在命令窗
口中输出 score 和 Rv。(10 分)
2014-01-07 2222.31 2246.79 2218.65 2238
2014-01-08 2240.64 2262.58 2228.42 2241.91 513488.5
2014-01-09 2236.97 2258.89 2220.8 2222.22 559870.4
2014-01-10 2216.52 2224.49 2200.22 2204.85 541692.9
2014-01-13 2207 2222.07 2183.6 2193.68 501227.7
2014-01-14 2192.84 2214.12 2179.91 2212.85 540499.5
437531
2014-01-15 2210.02 2215.9
…… …… ……
2193.8
……
2208.94 489624
…… ……
字段依次表示指数代码、交易日期、开盘价、最高价、最低价、收盘价、成交量。
建一个 Python 脚本,命名 test4.py,完成以下任务:
1)请计算如下指标:
A1(收盘价 / 均价):即收盘价 / 过去 10 个交易日的移动平均收盘价
A2(现量 / 均量):即成交量 / 过去 10 个交易日的移动平均成交量
A3(收益率):( 当日收盘价 - 前日收盘价 )/ 前日收盘价
剩余13页未读,继续阅读
资源评论
春哥111
- 粉丝: 1w+
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功