PROC SORT

2024-08-29 15:27:39 216人阅读

PROC SORT DATA=http://www.mamicode.com/输入数据集  <选项>;
    BY 关键变量;
RUN;

PROC SORT 语法如上，其中在尖括号中的可以不出现，也不会报错。

选项中常用的有两种NODUPKEY和NOUNIQUEKEY。

功能可以由字面意思帮助记忆，NO-没有，DUP-重复，KEY-关键变量，，，合起来就是数据集中指定的关键变量不重复，

其功能也一样，，去除重复的关键变量，这里的关键变量就是指跟在关键字BY后面的变量；还有一个对应的DUPOUT=选项用来输出被该（NODUPKEY）剔除的观测数据。

例如：

PROC SORT DATA=http://www.mamicode.com/ABC OUT=ABC1 DUPOUT=ABC2  NODUPKEY;
    BY ID;
RUN;

这里的ABC1数据集就是关于源数据集ABC中关于ID不重复的数据集（重复的观测只保留第一条），而ABC2则是存放重复ID的重复部分。

还有一个常用选项NOUNIQUEKEY,同样可以帮助记忆 NO-没有，UNIQUE-唯一， KEY-关键变量，，，合起来就是数据集中的关键变量不唯一；

功能呢个就是保留数据集中关于关键变量有多条观测的数据，还有一个对应的选项 UNIQUEOUT=选项用来输出关于关键变量的观测数据唯一的的部分。

例如；

PROC SORT DATA=http://www.mamicode.com/ABC UNIQUEOUT=ABC3 OUT=ABC4 NOUNIQUEKEY;
    BY KEY;
RUN;

这里输出的ABC3是关于KEY唯一的观测数据，而ABC4存放的就是关于key不唯一的观测数据.

PROC SORT

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们