Python:Python数据分析基础教程王斌会第六章数据的统计分析 图书学习打卡:Python数据分析基础教程/王斌会 第六章 数据的统计分析 6.1 随机变量及其分布 6.1.1 6.1.2 ##6.1 随机变量及其分布 ####6.1.1 均匀分布 a=0;b=1;y=1/(b-a) plt.plot(a,y); plt.hlines(y,a,b); plt.show() #plt.vlines(0,0,1);plt.vlines(1,0,1); #####(1)整数随机数 import random random.randint(10,20) #[10,20]上的随机整数 #####(2)实数随机数 random.uniform(0,1) #[0,1]上的随机实数 #####(3)整数随机数列 import numpy as np np.random.randint(10,21,9) #[10,20]上的随机整数 #####(4)实数随机数列 np.random.uniform(0,1,10) #[0,1]上的10个随机实数=np.random.rand(10) ###6.1. 在Python数据分析领域,掌握数据的统计分析是至关重要的。本教程是王斌会的《Python数据分析基础教程》的第六章,主要介绍了随机变量及其分布以及统计分析的基础知识。以下是本章涉及的一些关键知识点: 1. **随机变量及其分布**: - **均匀分布**:在区间[a, b]上,每个值出现的概率是相等的。在Python中,可以使用`random.randint(a, b)`生成[a, b]之间的整数随机数,`random.uniform(a, b)`生成[a, b]之间的实数随机数。 - **整数和实数随机数列**:利用numpy库,`np.random.randint(a, b, n)`可以生成[a, b)之间n个整数,而`np.random.uniform(a, b, n)`则生成[a, b]之间n个实数。 2. **正态分布**: - **标准正态分布**:均值为0,标准差为1的正态分布。在Python中,可以使用`math`库中的函数来计算与正态分布相关的概率。例如,`st.norm.cdf(x)`计算x标准差下的累积分布函数值。 - **正态随机数**:`np.random.normal(loc, scale, size)`函数用于生成均值为`loc`、标准差为`scale`的正态分布随机数序列。 3. **统计分析基础**: - **统计算法**:包括各种描述性统计量,如均值、中位数、方差、标准差等,这些是分析数据集的基本工具。 - **概率密度函数**:例如,可以使用matplotlib绘制正态分布的概率密度函数,以理解其形状和性质。 - **标准正态曲线面积**:用`scipy.stats`库中的`norm.ppf`或`norm.cdf`函数可以计算标准正态分布下的特定概率区域。 4. **统计推断方法**: - **点估计**:使用样本数据估计总体参数,如样本均值作为总体均值的估计。 - **区间估计**:给出一个包含总体参数的可信区间的估计,如置信区间的计算。 5. **正态概率图**:通过`seaborn`库的`distplot`函数或`scipy.stats.probplot`绘制正态概率图,以检验数据是否符合正态分布。 6. **直方图与密度图**:直方图用于展示数据分布,密度图则可以更直观地理解数据的分布形状。`matplotlib`和`seaborn`库都提供了绘制这些图形的功能。 通过以上知识的学习,读者将能够运用Python进行基本的数据统计分析,包括生成随机数、理解不同分布特性,以及进行初步的统计推断。这为后续更复杂的数据分析任务奠定了坚实的基础。
- 粉丝: 195
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助