dplyr包简介

dplyr包是plyr的迭代,使用过plyr的同学一定都赞叹过hadley大神的神作,以下内容简单介绍dplyr有哪些函数

  1. filter筛选行。如filter(flights,month==1,day==1),和subset类似,但是速度快很多
  2. slice按位置筛选。如slice(flights,1:10)选择1~10行
  3. arrange排序。如arrange(flights,year,month,day)
  4. select选择列。如select(flights,year,month,day)select(flights,-(year:day))
  5. rename重命名。如rename(flights,newname = oldname)
  6. distinct选择唯一值。如distinct(select(flights,tailnum))
  7. mutate添加新列。如mutate(flights,newcol1 = ...,newcol2 = ...)
  8. transmute只保留新列。
  9. summarise汇总。如summarise(flights,delay = mean(...),na.rm = TRUE)
  10. group_by分组。如group_by(flights,tailnum)按tailnum分组
  11. n()统计当前组的总数
  12. n_distinct(x)当前组的唯一值总数
  13. first(x)当前组的第一个值
  14. last(x)当前组的最后一个值
  15. nth(x,n)当前组的第n个值
喂他一颗糖