R语言学习（六）——dplyr包常用函数

xiaoxiao2025-09-03 249

filter()：筛选满足条件的行

例：利用R中自带包“survey”进行数据处理等同于：这种方法产生的数据框可能带有缺失值

arrange()：排序

当排序列有多个，前面的列有更高的排序优先级，默认从小到大的顺序，逆序要指定desc(var)或-var,var表示要排序的变量名。例： arrange(survey,Height,-Wr.Hnd)或arrange(survey,Height,desc(Wr.Hnd)) 将survey先按Height升序，再按Wr.Hnd降序

select()：选择变量列

例：（1）a=select(survey,Sex,Wr.Hnd,NW.Hnd,Height)选择等同于： a=survey[,c(1:3,10)] （2）b=select(a,-Height)剔除等同于： b=a[,-4]

mutate()：添加新变量

直接使用列名计算得到新变量例： mutate(survey,new=Wr.Hnd-NW.Hnd)

summary()：描述数据

例：

sample_n()：获取随机样本

例：对固定数字使用sample_n()，对固定分数使用sample_frac()。

group_by()：按分类型变量拆分数据

取消分组：ungroup()

转载请注明原文地址: https://www.6miu.com/read-5035681.html

Java

最新回复(0)