其他分享
首页 > 其他分享> > pandas数据结构

pandas数据结构

作者:互联网

1.Series是一种类似于一维数组的对象,它由一组数据和索引组成

1.1 仅有数据列表即可产生最简单的Series

import pandas as pd
s1 = pd.Series([1,'a',5.2,7])
print(s1)

- 操作

s1.index##获取索引 #RangeIndex(start=0, stop=4, step=1)
s1.values #array([1, 'a', 5.2, 7], dtype=object) 

1.2 创建一个具有标签索引的Series

s2 = pd.Series([1, 'a', 5.2, 7], index=['d','b','a','c'])

s2.index #Index(['d', 'b', 'a', 'c'], dtype='object')

1.3 使用python字典创建Series

sdata={'Ohio':35000,'Texas':72000,'Oregon':16000,'Utah':5000}
s3 = pd.Series(sdata)

1.4 根据标签索引查询数据

s2['c'] # 7
type(s2['a']) # float

2. DataFrame是一个表格型的数据结构

df = pd.DataFrame(
    {
        'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
        'year':[2000,2001,2002,2001,2002],
        'pop':[1.5,1.7,3.6,2.4,2.9]
    }
)

 

 - 操作

df.dtypes ##查询数据类型
df.columns #列名
df.index  #索引

3. 从DataFrame中查询出Series

-  如果只查询一行或者一列,则返回的是pd.Series

-  如果查询多行,多列,则返回的是pd.DataFrame

df['year'] #查询一列
type(df['year']) #pandas.core.series.Series
df[['year','pop']] #查询多列
df.loc[2] #查询第三行
df.loc[1:3] #查询一到三行
type(df.loc[1:3]) #pandas.core.frame.DataFrame

 

标签:df,Series,DataFrame,查询,pd,year,数据结构,pandas
来源: https://www.cnblogs.com/zengjirong/p/16434783.html