pandas数据结构
作者:互联网
1.Series是一种类似于一维数组的对象,它由一组数据和索引组成
1.1 仅有数据列表即可产生最简单的Series
import pandas as pd s1 = pd.Series([1,'a',5.2,7]) print(s1)
- 操作
s1.index##获取索引 #RangeIndex(start=0, stop=4, step=1) s1.values #array([1, 'a', 5.2, 7], dtype=object)
1.2 创建一个具有标签索引的Series
s2 = pd.Series([1, 'a', 5.2, 7], index=['d','b','a','c'])
s2.index #Index(['d', 'b', 'a', 'c'], dtype='object')
1.3 使用python字典创建Series
sdata={'Ohio':35000,'Texas':72000,'Oregon':16000,'Utah':5000} s3 = pd.Series(sdata)
1.4 根据标签索引查询数据
s2['c'] # 7 type(s2['a']) # float
2. DataFrame是一个表格型的数据结构
df = pd.DataFrame( { 'state':['Ohio','Ohio','Ohio','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9] } )
- 操作
df.dtypes ##查询数据类型 df.columns #列名 df.index #索引
3. 从DataFrame中查询出Series
- 如果只查询一行或者一列,则返回的是pd.Series
- 如果查询多行,多列,则返回的是pd.DataFrame
df['year'] #查询一列 type(df['year']) #pandas.core.series.Series df[['year','pop']] #查询多列 df.loc[2] #查询第三行 df.loc[1:3] #查询一到三行 type(df.loc[1:3]) #pandas.core.frame.DataFrame
标签:df,Series,DataFrame,查询,pd,year,数据结构,pandas 来源: https://www.cnblogs.com/zengjirong/p/16434783.html