首页 > 代码库 > 第4章--基本数据管理

第4章--基本数据管理

4.1 创建新变量

在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:

变量名←表达式

以上语句中的表达式部分可以分成包含多种运算符合函数。

 

4.2 变量的重编码

重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:

  • 将一个连续型变量修改为一组类别值;
  • 将误编码的值替换为正确值;
  • 基于一组分数线创建一个表示及格/不及格的变量

函数within(),它允许你修改数据框。

 

4.3 变量的重命名

可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。

或者,

reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。

 

4.4 缺失值

在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。

函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。

 

4.5 日期值

日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。

有两个函数对于处理时间戳数据特别实用。

Sys.Date()可以返回当天的日期;

data()返回当前的日期和时间。

第4章--基本数据管理