其他分享
首页 > 其他分享> > Pandas数据特征分析

Pandas数据特征分析

作者:互联网

对一组数据的理解(摘要:有损的提取数据特征的过程):

1. 基本统计(含排序)

2. 分布/累计统计

3. 数据特征:相关性、周期性等

4. 数据挖掘(形成知识)

Pandas库的数据排序:

.sort_index()方法在指定轴上根据索引进行排序,默认升序。

         .sort_index(axis=0,ascending=True)

 1 import numpy as np
 2 import pandas as pd
 3 
 4 b=pd.DataFrame(np.arange(20).reshape(4,5), index=['a','b','c','d'])
 5 
 6 b
 7 Out[4]: 
 8     0   1   2   3   4
 9 a   0   1   2   3   4
10 b   5   6   7   8   9
11 c  10  11  12  13  14
12 d  15  16  17  18  19
13 
14 b.sort_index(axis=0,ascending=True)
15 Out[5]: 
16     0   1   2   3   4
17 a   0   1   2   3   4
18 b   5   6   7   8   9
19 c  10  11  12  13  14
20 d  15  16  17  18  19
21 
22 b=pd.DataFrame(np.arange(20).reshape(4,5), index=['d','b','c','a'])
23 
24 b.sort_index(axis=0,ascending=True)
25 Out[7]: 
26     0   1   2   3   4
27 a  15  16  17  18  19
28 b   5   6   7   8   9
29 c  10  11  12  13  14
30 d   0   1   2   3   4
 1 c=b.sort_index(axis=1,ascending=False) #对1轴进行排序
 2 
 3 c
 4 Out[15]: 
 5     4   3   2   1   0
 6 d   4   3   2   1   0
 7 b   9   8   7   6   5
 8 c  14  13  12  11  10
 9 a  19  18  17  16  15
10 
11 c.sort_index()
12 Out[16]: 
13     4   3   2   1   0
14 a  19  18  17  16  15
15 b   9   8   7   6   5
16 c  14  13  12  11  10
17 d   4   3   2   1   0

.sort_values()方法在制定轴上根据数值进行排序,默认升序。

Series.sort_values(axis=0,ascending=True)

DataFrame.sort_values(by,axis=0,ascending=True) # by: axis轴上的某个索引或索引列表

 

b.sort_values('b',axis=1,ascending=False)
Out[18]: 
    4   3   2   1   0
d   4   3   2   1   0
b   9   8   7   6   5
c  14  13  12  11  10
a  19  18  17  16  15

b.sort_values(2,axis=0,ascending=False)
Out[20]: 
    0   1   2   3   4
a  15  16  17  18  19
c  10  11  12  13  14
b   5   6   7   8   9
d   0   1   2   3   4
a=pd.DataFrame(np.arange(12).reshape(2,6),index=['a','b'])

c=a+b

c
Out[34]: 
      0     1     2     3     4   5
a  15.0  17.0  19.0  21.0  23.0 NaN
b  11.0  13.0  15.0  17.0  19.0 NaN
c   NaN   NaN   NaN   NaN   NaN NaN
d   NaN   NaN   NaN   NaN   NaN NaN

c.sort_values(2)
Out[36]: 
      0     1     2     3     4   5
b  11.0  13.0  15.0  17.0  19.0 NaN
a  15.0  17.0  19.0  21.0  23.0 NaN
c   NaN   NaN   NaN   NaN   NaN NaN
d   NaN   NaN   NaN   NaN   NaN NaN

 

标签:sort,index,12,15,16,特征分析,NaN,数据,Pandas
来源: https://www.cnblogs.com/ldyj/p/10513009.html