其他分享
首页 > 其他分享> > DataFrame(5):DataFrame元素的获取方式(很重要)

DataFrame(5):DataFrame元素的获取方式(很重要)

作者:互联网

1、学习DataFrame元素获取,需要掌握以下几个需求

2、构造一个DataFrame

df = pd.DataFrame(np.random.randint(70,100,(4,5)), 
                  index=["地区1", "地区2", "地区3","地区4"], 
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

结果如下:
在这里插入图片描述
注意:不管是单独获取到一行、还是一列,得到的都是一个Series。不管是单独获取到多行、还是多列,得到的都是一个DataFrame。

x = df["广水"]
display(x)
display(type(x))

y = df.loc["地区1"]
display(y)
display(type(y))

结果如下:
在这里插入图片描述
总结如下:当获取DataFrame中的一列、多列的时候,可以直接传入单索引、数组索引。但是涉及获取行的时候,就不能使用这种方式,必须使用loc或者iloc的方式。

3、访问一列或多列:传入单个标签或标签数组

df = pd.DataFrame(np.random.randint(70,100,(4,5)), 
                  index=["地区1", "地区2", "地区3","地区4"], 
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

# 访问一列
x = df["武汉"]
display(x)

# 访问多列
y = df[["武汉","天门"]]
display(y)

结果如下:
在这里插入图片描述

4、访问一行或者多行:loc中传入标签索引、iloc中传入位置索引、切片方式、布尔数组方式

  特别说明:“访问行”唯独不能使用类似df[0],df[[0,1]],df[“地区1”],df[[“地区1”,“地区2”]]这样的方式。

① loc标签索引
df = pd.DataFrame(np.random.randint(70,100,(4,5)), 
                  index=["地区1", "地区2", "地区3","地区4"], 
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

x1 = df.loc["地区1"]
display(x1)

x2 = df.loc[["地区1","地区2"]]
display(x2)

结果如下:
在这里插入图片描述

② iloc位置索引
df = pd.DataFrame(np.random.randint(70,100,(4,5)), 
                  index=["地区1", "地区2", "地区3","地区4"], 
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

x3 = df.iloc[0]
display(x3)

x4 = df.iloc[[0,3]]
display(x4)

结果如下:
在这里插入图片描述

③ 切片方式:这种方式容易忽略,也容易弄错
df[0:2]
df[1:]

结果如下:
在这里插入图片描述

④ 布尔数组方式
df = pd.DataFrame(np.random.randint(70,100,(4,5)), 
                  index=["地区1", "地区2", "地区3","地区4"], 
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

y = df[df["武汉"] >= 80]
display(y)

结果如下:
在这里插入图片描述

5、访问某个值

如果说要访问上述数据框DataFrame中的95,应该怎么做呢?
在这里插入图片描述

① 先访问“地区3”这一行,再访问95这个数据
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.loc["地区3"]
df.loc["地区3"].loc["黄冈"]

结果如下:
在这里插入图片描述

② 先访问“黄冈”这一列,再访问95这个数据
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df["黄冈"]
df["黄冈"].loc["地区3"]

结果如下:
在这里插入图片描述

③ 向loc中传入数据的标签坐标、向iloc中传入数据的位置坐标(最常用)
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.loc["地区3","黄冈"]
df.iloc[2,2]

结果如下:
在这里插入图片描述

④ 向at中传入数据的标签坐标、向iat中传入数据的位置标签
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.at["地区3","黄冈"]
df.iat[2,2]

结果如下:
在这里插入图片描述

6、访问某几行中的某几列

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

# 先获取行,再获取列
df.loc[["地区1","地区3"]][["武汉","广水"]]

结果如下:
在这里插入图片描述

7、访问某几列中的某几行

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

# 先获取列,再获取行
df[["武汉","广水"]].loc[["地区1","地区3"]]

结果如下:
在这里插入图片描述

8、获取多行多列常用的一种方式:iloc+切片、loc+标签数组

① 获取多行多列:iloc+切片
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.iloc[:3,:]
display(x)

结果如下:
在这里插入图片描述

② 获取多行多列:loc+标签数组
df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]}, 
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.loc[["地区1","地区3"],['武汉','天门','黄冈','孝感','广水']]
display(x)

结果如下:
在这里插入图片描述

Huang supreme 发布了58 篇原创文章 · 获赞 74 · 访问量 1万+ 私信 关注

标签:广水,df,元素,DataFrame,获取,80,display,地区
来源: https://blog.csdn.net/weixin_41261833/article/details/104158011