其他分享
首页 > 其他分享> > pandas Series矢量化的字符串函数——Series.str

pandas Series矢量化的字符串函数——Series.str

作者:互联网

在清理文本数据时,对pandas Series(序列)可以使用map函数,所有的字符串都可以应用字符串函数或正则表达式,但是如果存在NA,就会报错。为了解决这个问题,Series有一些可以跳过NA值的字符串操作方法,这可以通过Series的str属性来访问。

s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])
s1.str.contains('og', regex=False)
0    False
1     True
2    False
3    False
4      NaN
dtype: object

通过str属性来调用字符串函数,处理非NA的文本数据。常用的字符串函数:

 

参考文档:

标签:False,Series,矢量化,特定,str,字符串,文本
来源: https://www.cnblogs.com/ljhdo/p/16579252.html