# -------------------------- 简介 -------------------------- #
# R 语言期中考试 2022年11月07日晚上07:00 - 08:45 共100分钟
# #不准商量
# #不准上网
# #允许看课堂笔记
# #一共25个空,每空4分,共100分
#
# 测试共有三部分
# 首先读取数据,然后完成每一部分
#
# 记得设置你的工作目录
#
# R 文件名以你的汉语拼音名字命名+midterm.R
# 运行结果放在Word 或 Powerpoint文件:你的汉语拼音名字命名+midterm.Docx/pptx
# 把两个文件发到我的QQ信箱 1640832148@qq.com
#
getwd()
setwd("E:/")
# load 需要的库
library()
library()
# 1. 用read_csv读取每一个文件:
# 记得先打开每一个文件熟悉格式
# 读入文件Forecast.csv生成tibble名字叫 forecast
# 读入文件Retail.csv生成tibble名字叫 retail
# 读入文件CustomerSalesbyProductCat.csv生成tibble名字叫 customerSalesbyProductCat
# -------------------------- 第一部分 (forecast) -------------------------- #
# 2. 整理forecast 为两个新的变量 Date 和 Forecast (提示:pivot_longer)
# 3. 把Date列换为Date类型 (提示:as_date)
# 4. 以Date 为 x, Forecast为 y, 画一线图(提示:geom_line).
# 用 BU 作为颜色
# 5. 以BU 为组, 组合forecast
# summarize Forecast 计算每一年的和 (提示:函数sum) (取名为 YrTotal)
# 按照降序排列 YrTotal
# 最后生成Tibble 名叫forecastByBU
# 记得用PIPE
# 6. 取出最高的两个BU并放在 tibble 名 top2 中
# 7. 以 BU 为x , YrTotal 为y 做一个 bar 图 (提示:geom_bar, stat用“identity”)
# -------------------------- 第二部分 (retail) -------------------------- #
# 8. 整理retail, 使用 Month 和 Sales (提示:pivot_longer)
# 9. 把Month转为一个Date类型,叫Actual_Date,年用2021年,日用1号
# (提示:make_date)
# 10. 把Sales变量重命名为 Actual (提示:colnames)
# 11. 用Month生成一个Date类型的列叫Forecast_Date, 年份用2022,日用1号
# 12. 生成一个新的列叫Forecast. 在Actual 基础上增加 10%
# 13. 生成一个Bar图,y用 2022 年 forecast, 把Forecast_Date 放在x,Forecast 放在y, 使用 Store 做填充
# ---------------------- 第三部分 (customerSalesbyProductCat) ---------------------- #
# 14.
# 用ProductCat 作为组 组合,summarize 销售量Amount,名字叫 TotalSales
# 最后生成的Tibble叫 products (用PIPE)
# 15. 得到排前五销量(sales)的产品(products)
#名字叫topProd
# 16. 在topProd中增加一列叫Year,都用 2021
# 17. 在topProd基础上产生一个tibble叫top2022,销量用在2021基础上增加5%的值,把所有的年改为2020.
# 18. 在topProd基础上产生一个tibble叫top2023,销量用在2022基础上增加5%的值,把所有的年改为2021.
# 19. 把2023年的,2022年的和topProd 按照行合起来 (提示:rbind)
# 最后的的名字叫topProd
# 20. 筛检topProd 只包括 'Touring Bikes' and 'Road Bikes'
# 21. 产生一个bar图
# Year 是 x, TotalSales 是 y, 填充用 ProductCat
# 22. 重组topProd, 变量用 Year 的值,值用TotalSales的值 (提示:pivot_wider)
# 23. 找出在topProd中,哪个产品(名字用:Top_contribution_product)对未来三年的贡献最大(绝对值意义上)
# 提示: 产生一个新的列=2023年对2021的增加,注意单引号的使用
# (topProd$...)
# 并用一个对话框输出相关信息
评论0
最新资源