超市零售数据分析-⼤数据项⽬ [实验数据] 本实验所⽤数据为国内某超市从2012年8⽉1⽇到2013年8⽉1⽇共⼀年的交易数据,包含了812,847条交易、2,893,385件单个商品以 及20,154名顾客。 该数据包含了3个数据集。 1. 交易概况 数据集已经存放在HDFS上,路径为"/data/13/2/sales_head/sales_head.csv",各字段以制表符分隔。数据集还存放在了Hive 上,表名为"bigdata_cases.retail_sales_head"。 各字段的定义为: 字段 定义 BillId 交易标识符 CustId 顾客会员标识符,⾮会员则为空 Quantity 交易包含的商品种类数 TransTime 交易时间 OrigTotalPrice 交易原始总价,可能包含分 Pay 顾客⽀付⾦额 Change 找零 ActualTotalPrice 交易实际总价,只精确到⾓ 数据集的前5⾏为: student1@master:~$ hdfs dfs -cat /data/13/2/sales_head/sales_head.csv " head -5 00034121002436593 600120168 3 2012-08-01 07:46:10 8.84 10 1.2 8.8 00034121002436594 1 2012-08-01 07:46:53 19.59 20 0.5 19.5 00034121002436595 2 2012-08-01 07:47:35 7 7 7 00034121002436596 600120168 3 2012-08-01 07:48:30 28.01 103 75 28 00034121002436597 600799218 2 2012-08-01 07:49:32 19.9 20 0.1 19.9 2. 交易明细 数据集已经存放在HDFS上,路径为"/data/13/2/sales_detail/sales_detail.csv",各字段以制表符分隔。数据集还存放在了 Hive上,表名为"bigdata_cases.retail_sales_detail"。 各字段的定义为: 字段 定义 BillId 交易标识符 RowNo 商品在交易中的次序 TransTime 交易时间 GoodId 商品标识符 Barcode 商品条形码 GoodName 商品名称 Unit 单位 Quantity 商品数量 OrigUnitPrice 商品原始单价 OrigTotalPrice 商品原始总价 ActualUnitPrice 商品实际单价 ActualTotalPrice 商品实际总价 数据集的前5⾏为: student1@master:~$ hdfs dfs -cat /data/13/2/sales_detail/sales_detail.csv " head -5 00034121002436593 1 2012-08-01 07:45:38 5440483 2186463 苦⽠(⼀级) 公⽄ 0.262 4 1.048 3.6 0.94 00034121002436593 2 2012-08-01 07:45:39 5440483 2186463 苦⽠(⼀级) 公⽄ 0.192 4 0.768 3.6 0.69 00034121002436593 3 2012-08-01 07:45:45 5440466 2186359 南⽠(⼀级) 公⽄ 4.052 1.98 8.023 1.78 7.21 00034121002436594 1 2012-08-01 07:45:26 5110324 6934665081392 蒙⽜益⽣菌酸⽜奶(原味)1.2kg 桶 1 19.59 19.59 19.59 19.59 00034121002436595 1 2012-08-01 07:47:18 5110467 6901209206146 光明酸⽜奶(红枣味)180g 盒 2 3.5 7 3.5 7 3. 商品信息 数据集已经存放在HDFS上,路径为"/data/13/2/good/good.csv",各字段以制表符分隔。数据集还存放在了Hive上,表名 为"bigdata_cases.retail_good"。 各字段的定义为: 字段 定义 GoodId 商品标识符 Category1Name 商品所属的⼤类名称 Category2Name 商品所属的中类名称 Category3Name 商品所属的⼩类名称 Category4Name 商品所属的细类名称 BrandName 顾客⽀付⾦额 GoodName 商品名称 数据集的前5⾏为: student1@mas
- 粉丝: 167
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助