星巴克数据分析案例及数据集.zip_jupyter星巴克门店数据资源-CSDN文库

共2个文件

py：1个

csv：1个

数据分析

1星需积分: 46 159 浏览量 2019-11-07 13:53:18 上传评论 18 收藏 1.04MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

星巴克数据分析案例及数据集.zip （2个子文件）

星巴克数据分析案例及数据集

directory.csv 3.92MB

星巴克数据分析.py 1KB

import numpy as np import pandas as pd data = pd.read_csv('directory.csv')# 读取数据，将文件转换为DataFrame格式 data.head() data.describe()# 用于查看数值型数据的分布情况 data.info()# 用于查看各字段的数据类型，以及缺失情况 data['Brand'].unique()# 查看唯一品牌的类型 data = data[data['Brand'] == 'Starbucks']# 只获取品牌为Starbucks data['Brand'].unique() data.isnull().sum()# 各个字段缺失值的数量 data[data['City'].isnull()]# 查看缺失城市是哪些 # 用国家字段填充到城市字段上 def fill_na(x): return x data['City'] = data['City'].fillna(fill_na(data['State/Province'])) data[data['Country'] == 'EG'] #台湾被美国当成一个国家，把他重新赋值到中国来 data['Country'][data['Country'] == 'TW'] = 'CN' country_count = data['Country'].value_counts()[0:10] import matplotlib.pyplot as plt #import matplotlib #matplotlib.matplotlib_fname() # 将会获得matplotlib包所在文件夹 plt.rcParams['font.sans-serif'] = ['simhei']# 指定默认字体 plt.rcParams['axes.unicode_minus'] = False# 用来正常显示坐标轴上的负号（‘-’） plt.title('全球星巴克数量前十的国家') country_count.plot(kind = 'bar') country_city_count = data['City'].value_counts()[0:10] plt.title('全球星巴克数量前十的城市') country_city_count.plot(kind = 'barh') china_data = data[data['Country'] == 'CN'] china_data.head() city_count = china_data['City'].value_counts()[0:10] plt.title('中国星巴克数量前十的城市') city_count.plot(kind = 'barh')

评论收藏

内容反馈