首页 > 代码库 > R语言学习笔记5
R语言学习笔记5
数值变量的特征和可视化
·数据集中趋势的测量(measures of center)
— 均值(mean)、中位数(median)、众数(mode)
·数据分散趋势的测量(measus of spread)
— 值域(range:max-min)、方差(variance)、标准差(standard variance)、四分位距(interquartile range)
·稳健统计量(robust statistics)
— 是:中位数、四分位差(受极端值影响小)
— 否:均值、标准差、值域(受极端值影响大)
·一个变量的可视化
— 柱状图(histogram)、点图(dot plot)(分布)
— 箱图(box plot)(中位数、分位点、极端值)
· 两个变量的关系
— 散点图(scatter plot):方向、形状、强度、极端值
分类变量的特征和可视化
·一个分类变量的可视化
— 频率表(frequency table)、条形图(bar plot)
·两个分类变量的关系
— 关联表(contingency table)、相对频率表(relative frequency)
— 分段条形图、相对频率分段条形图
— 马赛克图(mosaicplot)
·一个分类变量、一个数值变量的关系
—并排箱图(side-by-side box plot)
R语言学习笔记5
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。