实验题目:描述性统计分析实验
实验目的:熟悉和掌握一维和多维数据的数字特征及相关分析,通过 Python 软件求出所给
数据的相应数据特征、相关系数和相关矩阵,根据结果分析并给出结论。
实验内容:
1、根据文件“例 1 数据.txt”
(1)求出数据的均值、中位数、上下四分位数和 0.99,0.90,0.10,0.05,0.01 分位数;
(2)求出数据的方差、标准差、变异系数、极差、四分位极差和四分位标准差。
2、根据文件“例 3 数据.txt”,求出各列数据的均值、中位数、标准差、方差、上下四分位数、
极差、四分位极差、偏度和峰度。
3、根据文件“例 10 数据.txt”,计算观测数据的均值向量、协方差矩阵、Spearman 相关矩阵。
———————————————————————————————————————
1、import numpy as np
#loadtxt 的功能是读入数据文件,这里的数据文件要求每一行数据的格式相同。
getdata=np.loadtxt('例 1 数据.txt')
#flatten(order)返回折叠为一维的数组副本
getdata1=getdata.flatten()
#数据排序
a=np.sort(getdata1)#getdata1 排序
n=len(a) #a 的长度
Quantile=[0.75,0.25,0.99,0.90,0.10,0.05,0.01]#所需要求的分位数
for p in Quantile:
print(p,'分位数=',b)
getdata_X=np.mean(getdata1) #求均值
M=np.median(getdata1) #求中位数
print('均值=',getdata_X)
print('中位数=',M)
print('=================================================')
#参数 ddof 有两种取法,取 0 即用总体方差公式,取 1 即方差公式中除 n-1,为样本方差公
式
getdata_var=np.var(getdata1,ddof=1) #求方差
getdata_std=np.std(getdata1,ddof=1) #求标准差(也可以通过对样本方差开平方求得)
#下面补全变异系数、极差、四分位极差和四分位标准差
getdata_CV= #计算变异系数
getdata_R= #计算极差
getdata_R1= #计算四分位极差
getdata_std1= #计算四分位标准差
print('方差=',getdata_var,' ','标准差=',getdata_std)
print('变异系数=',getdata_CV,' ','极差=',getdata_R)
print('四分位极差=',getdata_R1,' ','四分位标准差=',getdata_std1)
2、
import pandas as pd
补全