filter():筛选满足条件的行
例: 利用R中自带包“survey”进行数据处理 等同于: 这种方法产生的数据框可能带有缺失值
arrange():排序
当排序列有多个,前面的列有更高的排序优先级,默认从小到大的顺序,逆序要指定desc(var)或-var,var表示要排序的变量名。 例: arrange(survey,Height,-Wr.Hnd)或arrange(survey,Height,desc(Wr.Hnd)) 将survey先按Height升序,再按Wr.Hnd降序
select():选择变量列
例: (1)a=select(survey,Sex,Wr.Hnd,NW.Hnd,Height)选择 等同于: a=survey[,c(1:3,10)] (2)b=select(a,-Height)剔除 等同于: b=a[,-4]
mutate():添加新变量
直接使用列名计算得到新变量 例: mutate(survey,new=Wr.Hnd-NW.Hnd)
summary():描述数据
例:
sample_n():获取随机样本
例: 对固定数字使用sample_n(),对固定分数使用sample_frac()。
group_by():按分类型变量拆分数据
取消分组:ungroup()