首页 > 代码库 > R语言统计分析技术研究 特征值选择技术要点
R语言统计分析技术研究 特征值选择技术要点
特征值选择技术要点
作者:王立敏
文章来源: 网络
1.特征值
特征值是线性代数中的一个重要概念。在数学,物理学,化学,计算机等领域有着广泛的应用。设A是n阶方阵,如果存在数m和非零n维列向量x,使得Ax=mx成立,则称m是A的一个特征值或本征值。非零n维列向量x称为矩阵A的属于特征值m的特征向量或本征向量,简称A的特征向量或A的本征向量。
2.使用R语言的Boruta包进行特征选择
在数据分析过程中,利用各种图表进行数据探索是必要的前期工作 。描述性统计中就包括了直方图,散点图等工具来探索连续数据,则可以采用条形图,交叉分组表等工具。Excel中所谓的“数据透视表”,其实就是一个交互式的交叉分组表。
3.R语言对时间序列特征值的提取
有一组一分钟序列的数据(一个变量),想想提取这个时间序列的特征参数,并作为聚类算法的输入,实现对这组数据的分类。
4.求矩阵的特征值和特征向量
函数eigen(Sm) 用来计算矩阵Sm 的特征值和特征向量。这个函数的返回值是一个
含有values 和vectors 两个分量的列表。命令
> ev <- eigen(Sm)
将把这个列表赋给ev。ev$val 表示Sm 的特征值向量,ev$vec 则是相应特征向量构成
的一个矩阵。假定我们仅仅需要特征值,我们可以采用如下的命令:
> evals <- eigen(Sm)$values
evals 现在拥有特征向量,而第二个分量则被抛弃了。如果以下面的表达式作为一个
命令,
> eigen(Sm)
这两个成分连同它们的名字都会被显示。对于大的矩阵,若无必要,最好不要用下面
的表达式计算特征向量
> evals <- eigen(Sm, only.values = TRUE)$values
R语言统计分析技术研究 特征值选择技术要点