Pandas数据特征分析
作者:互联网
对一组数据的理解(摘要:有损的提取数据特征的过程):
1. 基本统计(含排序)
2. 分布/累计统计
3. 数据特征:相关性、周期性等
4. 数据挖掘(形成知识)
Pandas库的数据排序:
.sort_index()方法在指定轴上根据索引进行排序,默认升序。
.sort_index(axis=0,ascending=True)
1 import numpy as np 2 import pandas as pd 3 4 b=pd.DataFrame(np.arange(20).reshape(4,5), index=['a','b','c','d']) 5 6 b 7 Out[4]: 8 0 1 2 3 4 9 a 0 1 2 3 4 10 b 5 6 7 8 9 11 c 10 11 12 13 14 12 d 15 16 17 18 19 13 14 b.sort_index(axis=0,ascending=True) 15 Out[5]: 16 0 1 2 3 4 17 a 0 1 2 3 4 18 b 5 6 7 8 9 19 c 10 11 12 13 14 20 d 15 16 17 18 19 21 22 b=pd.DataFrame(np.arange(20).reshape(4,5), index=['d','b','c','a']) 23 24 b.sort_index(axis=0,ascending=True) 25 Out[7]: 26 0 1 2 3 4 27 a 15 16 17 18 19 28 b 5 6 7 8 9 29 c 10 11 12 13 14 30 d 0 1 2 3 4
1 c=b.sort_index(axis=1,ascending=False) #对1轴进行排序 2 3 c 4 Out[15]: 5 4 3 2 1 0 6 d 4 3 2 1 0 7 b 9 8 7 6 5 8 c 14 13 12 11 10 9 a 19 18 17 16 15 10 11 c.sort_index() 12 Out[16]: 13 4 3 2 1 0 14 a 19 18 17 16 15 15 b 9 8 7 6 5 16 c 14 13 12 11 10 17 d 4 3 2 1 0
.sort_values()方法在制定轴上根据数值进行排序,默认升序。
Series.sort_values(axis=0,ascending=True)
DataFrame.sort_values(by,axis=0,ascending=True) # by: axis轴上的某个索引或索引列表
b.sort_values('b',axis=1,ascending=False) Out[18]: 4 3 2 1 0 d 4 3 2 1 0 b 9 8 7 6 5 c 14 13 12 11 10 a 19 18 17 16 15 b.sort_values(2,axis=0,ascending=False) Out[20]: 0 1 2 3 4 a 15 16 17 18 19 c 10 11 12 13 14 b 5 6 7 8 9 d 0 1 2 3 4 a=pd.DataFrame(np.arange(12).reshape(2,6),index=['a','b']) c=a+b c Out[34]: 0 1 2 3 4 5 a 15.0 17.0 19.0 21.0 23.0 NaN b 11.0 13.0 15.0 17.0 19.0 NaN c NaN NaN NaN NaN NaN NaN d NaN NaN NaN NaN NaN NaN c.sort_values(2) Out[36]: 0 1 2 3 4 5 b 11.0 13.0 15.0 17.0 19.0 NaN a 15.0 17.0 19.0 21.0 23.0 NaN c NaN NaN NaN NaN NaN NaN d NaN NaN NaN NaN NaN NaN
标签:sort,index,12,15,16,特征分析,NaN,数据,Pandas 来源: https://www.cnblogs.com/ldyj/p/10513009.html