其他分享
首页 > 其他分享> > 数据分析核心包pandas

数据分析核心包pandas

作者:互联网

一 pandas简介

pandas是一个强大的Python数据分析的工具包, 是基于NumPy构建的
pandas的主要功能

安装方法: pip install pandas
引用方法:import pandas as pd

二 pands的Series对象

1 Series 一维数据对象

Seriaes是一种类似于一位数组的对象, 由一组数据和一组与之相关的数据标签(索引)组成新的二维数组
创建方式:

pd.Series([4,7,-5,3])
pd.Series([4,7,-5,3], index=['a', 'b', 'c', 'd'])
pd.Series({'a':1, 'b':2})
pd.Series(0, index=['a','b','c','d'])

获取值数组和索引数据: values属性和index属性
Series比较像列表(数组)和字典的结合体

2 Series使用特性

Series支持array的特性(下标):

Series支持字典的特性(标签):

3 Series整数索引问题

整数索引的pandas对象往往会使新手抓狂的地方
例如:

如果索引是整数类型,则根据整数进行下标获取值时总是面向标签的。
解决方法: loc属性(将索引解释为标签)和iloc属性(将索引解释为下标)
如:sr2.loc[10] sr2.iloc[-1]

4 Series数据对齐

例:

pandas在进行两个Series对象的运算时,会按索引进行对齐然后计算

如何使用结果再索引'b'处的值为11, 在索引‘d’处的值为34?

5 Series缺失值处理

缺失数据:使用NaN(Not a Number) 来表示缺失数据。其值等于np.nan。内置的None值也会被当做NaN处理

sr.isnull()       Nan返回True
sr.notnull()      Nan但会False
sr.dropna()       删除索引Nan
sr.fillna(0)      填充所有的nan

 过滤缺失数据:sr.dropna() 活 sr[data.notnull()]

 填充缺失数据:fillna(0)

标签:数据分析,Series,核心,sr2,索引,pd,sr,pandas
来源: https://www.cnblogs.com/harryblog/p/10818251.html