NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
直方图、经验分布函数与QQ图
• 对于数据分布,常用直方图进行描述.将数据取值的范围分
成假设干区间,区间的长度称为组距.考察数据落入每一区
间的频数与频率,在每个区间上画一矩形,它的宽度是组距,
它的高度可以是频数、频率或频率/组距,在高度是频率/组
距的情况,每一矩形的面积恰是数据落入区间的频率,这种
直方图可估计总体的概率密度.
• 组距对直方图的形态有很大的影响,组距太小,每组的频数
较少,因随机性的影响,邻近区间上的频数会很大;组距太
大,直方图所反映概率密度的形态就不灵敏.
10/13/2021
第三页,共60页。
评论0
最新资源