首页 > 代码库 > 第4章--基本数据管理
第4章--基本数据管理
4.1 创建新变量
在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:
变量名←表达式
以上语句中的表达式部分可以分成包含多种运算符合函数。
4.2 变量的重编码
重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:
- 将一个连续型变量修改为一组类别值;
- 将误编码的值替换为正确值;
- 基于一组分数线创建一个表示及格/不及格的变量
函数within(),它允许你修改数据框。
4.3 变量的重命名
可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。
或者,
reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。
4.4 缺失值
在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。
函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。
4.5 日期值
日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。
有两个函数对于处理时间戳数据特别实用。
Sys.Date()可以返回当天的日期;
data()返回当前的日期和时间。
第4章--基本数据管理
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。