R语言—数据的调整与处理
作者:互联网
作为一名R语言新手,第一步是要学会对数据进行一个调整与处理。现介绍几种常见对数据框架处理的函数:
使用R语言自带的heightweight数据集:
library(gcookbook)
heightweight
可以看到五列代表每个人的身体信息,这个时候我们可以用str()来查看数据集的结构。
str(heightweight)
这里面可以看到sex为factor因子变量;ageYear,heightIn,weightLb为数值型向量;ageMonth为整型向量;同时还会有character字符型向量。(在画图中,经常要将factor和character相互转化)
调整一:选择需要的变量列(使用函数select())
heightweight%>%select(sex,heightIn)
调整二:对某一变量数据进行排序(arrange())
heightweight%>%arrange(heightIn) #(数据heightIn从原始状态变为从小到大排序)
heightweight%>%arrange(desc(heightIn)) #(从大到小排序)
从小到大 从大到小
可以几个变量一起调整
heightweight%>%arrange(desc(heightIn,heightLb))
调整三:筛选掉某变量中的值(filter())
heightweight%>%filter(heightIn>60) #(筛选出heightIn>60的值)
heightweight%>%filter(heightIn>60,weightLb>110) #(筛选出heightIn大于60,“且”weightLb大于110的值)
调整四:添加变化的变量到原始数据中(mutate())
For example:计算weightLb与heightIn的比值,并且将比值数据添加为原始数据的第一列
heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(w_h,everything())
如果你想把比值放在第四列
heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(sex,ageYear,ageMonth,w_h,everything())
数据基本调整函数就这些,关于数据转化,计算,请关注下一次内容。
如果这些内容对你有帮助,请点个赞啦!
标签:60,语言,处理,arrange,weightLb,heightIn,调整,select,heightweight% 来源: https://blog.csdn.net/m0_61206827/article/details/121232275