首页 > 代码库 > SAS描述统计量

SAS描述统计量

MEANS过程

  • MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。
  • BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。

  技术分享

proc means data=http://www.mamicode.com/data.bank>

 UNIVARIATE过程

  • UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。
  • 使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都基本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的基本统计量和一些关于位置检验的结果。
proc univariate data=http://www.mamicode.com/data.bank;>

 FREQ过程

  • 描述分析,产生频数表和列联表,可以简单的描述数据
  • 统计推断产生各种统计量,分析变量之间的关系
  • TableS 用来定义频数表或交叉表,可以有多个tables语句。当频数表是命令为tables JOB1, 生成一维表;而命令为: tables JOB1*good_bad;变量之间中间用*隔开,表示生成二维交叉表
  • Tables后的选项为norow nocol nopercent:若只需要频数,不需要各行各列的百分比,可在tables后面加上这些参数
proc freq data=http://www.mamicode.com/data.bank;>
  • 对连续数值变量做Freq时,系统会对每个数值进行频数统计,这个结果一般不是我们所需要的。我们一般会将连续变量转换为离散变量,这个可以通过Format程步来实现。
proc format;
  value age_cd
  17-<25=‘<25‘
  25-<30=‘25-30‘
  30-<45=‘30-45‘
  45-<60=‘45-60‘
  60-high=‘>=60‘;
run;
proc  freq data=http://www.mamicode.com/data.bank;>

 

SAS描述统计量