其他分享
首页 > 其他分享> > 每日随笔

每日随笔

作者:互联网

今天使用pandas进行数据处理,由于刚入门pandans,对其中的部分操作并不是特别的熟悉,也给自己造成了不少的困扰。

当然其方便的功能与spark相比还是有很大的优势,我也感觉十分的方便。

首先是对其中mean(),describe(),sum(),count()的使用,这些函数都是对于DataFrame数据进行处理的便利函数。

最重要的是通过官方文档来学习pandas.DataFrame.index — pandas 1.4.1 documentation (pydata.org)

1.pandas获取数据的行数与列数

df = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6]})
df.shape # 形状,格式是(行数,列数)
df.shape[0] # 行数
df.shape[1] # 列数

2.pandas遍历DataFrame数据

import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.DataFrame(inp)
print(df)

# pandas 遍历 dataframe 行数据
for index, row in df.iterrows():
    print(index,row[0],row[1],)

# pandas 遍历 dataframe 列数据
for x in df.loc[:,'c1']:
    print(x)

3.pandas保存csv文件

dff3.to_csv('..\data.csv', index=False)

4.pandas求平均值sort_values("列名")

5.两个表格进行合并

pd.merge(dfm3,dfa3,how='inner',on='用户编号')

6.pandas的图表联动可视化,推荐使用altair

入门(54条消息) 使用Altair实现Python交互式数据可视化_-派神-的博客-CSDN博客_altair python

altair.repeat — Altair 4.2.0 documentation (altair-viz.github.io)

  

  

 

标签:index,df,每日,DataFrame,altair,pd,随笔,pandas
来源: https://www.cnblogs.com/zhanghua-lijie/p/16074800.html