每日随笔
作者:互联网
今天使用pandas进行数据处理,由于刚入门pandans,对其中的部分操作并不是特别的熟悉,也给自己造成了不少的困扰。
当然其方便的功能与spark相比还是有很大的优势,我也感觉十分的方便。
首先是对其中mean(),describe(),sum(),count()的使用,这些函数都是对于DataFrame数据进行处理的便利函数。
最重要的是通过官方文档来学习pandas.DataFrame.index — pandas 1.4.1 documentation (pydata.org)
1.pandas获取数据的行数与列数
df = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6]}) df.shape # 形状,格式是(行数,列数) df.shape[0] # 行数 df.shape[1] # 列数
2.pandas遍历DataFrame数据
import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print(df) # pandas 遍历 dataframe 行数据 for index, row in df.iterrows(): print(index,row[0],row[1],) # pandas 遍历 dataframe 列数据 for x in df.loc[:,'c1']: print(x)
3.pandas保存csv文件
dff3.to_csv('..\data.csv', index=False)
4.pandas求平均值sort_values("列名")
5.两个表格进行合并
pd.merge(dfm3,dfa3,how='inner',on='用户编号')
6.pandas的图表联动可视化,推荐使用altair
入门(54条消息) 使用Altair实现Python交互式数据可视化_-派神-的博客-CSDN博客_altair python
altair.repeat — Altair 4.2.0 documentation (altair-viz.github.io)
标签:index,df,每日,DataFrame,altair,pd,随笔,pandas 来源: https://www.cnblogs.com/zhanghua-lijie/p/16074800.html