体育收入排行2012-2019:使用Python进行
数据分析
简介
在体育界,运动员的收入一直是公众关注的焦点。从2012年到2019年,体育收入排行榜不断变化,反
映了体育市场和运动员个人品牌价值的波动。本文将使用Python编程语言,通过分析公开数据来展示这
段时间内的体育收入排行情况。
环境准备
在开始之前,请确保您的Python环境中安装了以下库:
pandas :用于数据处理和分析。
matplotlib :用于数据可视化。
安装命令如下:
数据获取
首先,我们需要获取2012-2019年体育收入的数据。这些数据通常可以从体育统计网站、数据库或公开
的API获取。为了示例,我们将使用一个假设的数据集,您可以根据实际情况替换为真实数据。
数据处理
在分析之前,我们需要对数据进行一些基本的处理。
import pandas as pd
# 假设的数据集,包含年份、运动员姓名和收入
data = {
'Year': [2012, 2012, 2013, 2013, 2019, 2019],
'Athlete': ['LeBron James', 'Lionel Messi', 'Cristiano Ronaldo', 'Usain
Bolt', 'Roger Federer', 'Serena Williams'],
'Income ($M)': [53, 45, 80, 32, 90, 89]
}
# 创建DataFrame
df = pd.DataFrame(data)
# 确保收入列是数值类型
df['Income ($M)'] = pd.to_numeric(df['Income ($M)'])
# 按年份和收入降序排列
df_sorted = df.sort_values(by=['Year', 'Income ($M)'], ascending=[True, False])