SAS中的描述性统计过程
SAS中的描述性统计过程可以用四个不同的过程来实现,它们分别是means过程、summary过程、univariate过程和tabulate过程。这些过程在功能和操作方法上存在一定的差异,下面我们大概了解一下它们的异同点。
means过程和summary过程可以计算出样本的偏度(skewness)和峰度(kurtosis),而univariate过程可以计算出样本的众数(mode)。tabulate过程不计算这些统计量。univariate过程具有统计制图的功能,而其它三个过程则没有。
means过程和summary过程的格式非常相似,proc语句后的选项主要用来指定所要计算的统计量,默认情况下,Means过程会给出频数、均数、标准差、最大值和最小值等,其余统计量的计算均需要在选项中指定。class语句所指定的分组变量用来进行分组,而by语句所指定的分组变量是用来将数据分为若干个更小的样本,以便SAS分别在各小样本进行各自独立的处理。freq语句和weight语句分别引导代表记录出现频数和权重系数的数值变量。var语句引导所要进行分析的所有变量的列表,SAS将对var语句所引导的所有变量分别进行描述性统计分析。
summary过程的格式和means过程可以说是完全相同的,各条语句和选项的含义也是相同的,包括在means过程中未列出的output语句也可以应用于means过程,只是此语句在summary过程应用较多(这样才能将分析结果显示出来),所以才将其列入一般格式中。output语句用来对分析结果输出为数据文件进行控制,其后的选项可有可无,若无则SAS按照默认方式进行。
统计制图的过程可以实现对样本分布特征的图形表示,一般情况下可以使用的有chart过程、plot过程、gchart过程和gplot过程。这些过程可以绘制出不同的图形,如条形图、圆图、环形图和星形图等,还可以绘制散点图和线图等。chart过程和plot过程绘制的图形类似于我们用文本字符堆积起来的图形,而gchart过程和gplot过程给出的是真正意义上的图形,可以用很多的语句和选项来控制图形的各方面的性质和特征。
SAS中的描述性统计过程可以根据实际需求选择不同的过程和格式,从而实现对样本分布特征的描述和图形表示。