首页 > 代码库 > R语言实战之创建数据集

R语言实战之创建数据集


数据结构

向量:

向量是用于存储数值型、字符型或逻辑型数据的一维数组。

可通过函数c()可用来创建向量

实例操作:

技术分享

矩阵

矩阵是一个二位数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)

可通过函数matrix()创建矩阵

实例操作:

技术分享

数组

数组(array)与矩阵类似,但是维度可以大于2

数组可通过array函数创建

实例操作:

技术分享

数据框

由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。数据框是R中最常处理的数据结构

数据框可通过函数data.frame()创建

实例操作:

技术分享

因子

类别(名义型)变量和有序类别(有序型)在R中称为因子。因子在R中非常重要,因为它决定了数据的分析方式以及如何进行视觉呈现。名义型变量是没有顺序之分的类别变量。有序型变量表示一种顺序关系,而非数量关系。连续型变量可以呈现为某个范围内的任意值。

函数factor()以一个整数向量的形式存储类别值,整数的取值范围是[1...k],同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。

实例操作:

技术分享

列表

列表就是一些对象的有序集合,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。

可以使用函数list()创建列表:

技术分享

数据的输入

R可以从键盘、文本文件、excel、数据库以及其他各种软件中导入数据,在这里只是用excel的导入作为例子,来了解一下大致的操作。

导入Excel数据

因为使用到了xlsx包,所以要先安装一下。导入的excel是格力电器的财报数据。这里可以看到excel的数据被转换成了R中的数据框。

技术分享

一些简单操作

可以查看格力电器的收入和净利润,或者进一步看最近七年的这两项数据。

技术分享

R语言实战之创建数据集