R语言学习(六)——dplyr包常用函数

xiaoxiao2025-09-03  249

filter():筛选满足条件的行

例: 利用R中自带包“survey”进行数据处理 等同于: 这种方法产生的数据框可能带有缺失值

arrange():排序

当排序列有多个,前面的列有更高的排序优先级,默认从小到大的顺序,逆序要指定desc(var)或-var,var表示要排序的变量名。 例: arrange(survey,Height,-Wr.Hnd)或arrange(survey,Height,desc(Wr.Hnd)) 将survey先按Height升序,再按Wr.Hnd降序

select():选择变量列

例: (1)a=select(survey,Sex,Wr.Hnd,NW.Hnd,Height)选择 等同于: a=survey[,c(1:3,10)] (2)b=select(a,-Height)剔除 等同于: b=a[,-4]

mutate():添加新变量

直接使用列名计算得到新变量 例: mutate(survey,new=Wr.Hnd-NW.Hnd)

summary():描述数据

例:

sample_n():获取随机样本

例: 对固定数字使用sample_n(),对固定分数使用sample_frac()。

group_by():按分类型变量拆分数据

取消分组:ungroup()

转载请注明原文地址: https://www.6miu.com/read-5035681.html

最新回复(0)