首页 > 代码库 > R语言学习笔记5

R语言学习笔记5

数值变量的特征和可视化

·数据集中趋势的测量(measures of center

 — 均值(mean)、中位数(median)、众数(mode) 

·数据分散趋势的测量(measus of spread

 — 值域(range:max-min)、方差(variance)、标准差(standard variance)、四分位距(interquartile range 

·稳健统计量(robust statistics

 — 是:中位数、四分位差(受极端值影响小)

 — 否:均值、标准差、值域(受极端值影响大

·一个变量的可视化

 — 柱状图(histogram)、点图(dot plot)(分布)

 — 箱图(box plot)(中位数、分位点、极端值)

技术分享

· 两个变量的关系

 — 散点图(scatter plot):方向、形状、强度、极端值


分类变量的特征和可视化

·一个分类变量的可视化

 — 频率表(frequency table)、条形图(bar plot

技术分享

·两个分类变量的关系

 — 关联表(contingency table)、相对频率表(relative frequency

 — 分段条形图、相对频率分段条形图

技术分享

 — 马赛克图(mosaicplot

技术分享

·一个分类变量、一个数值变量的关系

 —并排箱图(side-by-side box plot  

技术分享

R语言学习笔记5