其他分享
首页 > 其他分享> > pandas 的 apply() 函数

pandas 的 apply() 函数

作者:互联网

 

一、apply() 函数 

DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)

参数解释:

(1)func:就是函数,不管是自定义的函数,还是匿名函数lambda

(2)axis:0表示以列作为一组计算,结果按行排序→,1表示以行作为一组(每条记录)计算,结果按列排序↓,默认axis=0

 

二、apply的使用总共基本用于三处:

(1)是你要对每条记录进行遍历用函数计算出一个值;此时,axis=1

(2)是你要对某一列进行操作;此时,axis=0

(3)是你groupby后要对每个group后的字表df 

df.apply(lambda x:func(x,args**),axis=1)
df.apply(lambda x:func(x,args**),axis=0)
df.groupby([column1]).apply(lambda x:func(x,args**))

 

三、理解apply核心在于明确两个环节:调度函数和作用对象。

调度函数就是apply接收的参数,既可以是Python内置的函数,也支持自定义函数,或者匿名函数lambda。只要符合指定的作用对象(即是标量scalar,还是一行或一列series,亦或一个dataframe)即可。

作用对象则取决于调用apply的对象类型,具体来说:

apply应用在Pandas中,其核心功能其实可以概括为一句话:我本身不处理数据,我们只是数据的搬运工。

apply自身是不带有任何数据处理功能的,但可以用作是对其他数据处理方法(函数)的调度器,至于调度什么又为谁而调度呢?这是理解apply的两个核心环节:

标签:函数,Series,DataFrame,数据处理,apply,pandas,axis
来源: https://www.cnblogs.com/zwt20120701/p/16603240.html