编程语言
首页 > 编程语言> > python数据分析基础

python数据分析基础

作者:互联网

1.常用python模块

2.python数据结构和序列

元组:元组是一个固定长度,不可改变的python序列对象。

tup=(2,3,4)

元组(tuple)方法

列表: 与元组相比,列表长度可变,内容可被修改。

list=[2,3,5,none]

列表的方法:

在列表中检索速度比字典和集合速度慢,因为列表是线性搜索,而在字典和集合中,是基于哈希表的检索,在同一时间内还可以检查其他项

列表操作

1.二分搜索和维护已排序的列表

bisect 模块支持二分查找,和向已排序的列表插入值。
bisect.bisect(list_name,element): 找到插入值后仍保证排序的位置
bisect。insort(list,index) :向列表中index位置插入值

import bisect
c=[1,2,2,2,3,4,7]
print(bisect.bisect(c,2)) #out:4
pirnt(bisect.bisect(c,5)  #out :6
bisect.insort(c,6)
print(c) #out :[1,2,2,2,3,4,6,7]

2.常用函数

enumerate函数: 可以返回元组序列;

some_list=['foo','bar','baz']
mapping={}
for i ,v in enumerate(some_list):
     mapping[v]=i
print(mapping)
#out:{'bar':1,'baz':2;'foo':0}

zip函数:
zip函数可以将多个列表、元组或其他序列晨读组合城一个元组列表:

seq1=['foo','bar','baz']
seq2=['one','two','three']
zipped=zip(seq1,seq2)
list(zipped)
# out :[('foo','noe'),('bar','two'),('baz','three')]

zip函数还可以用来解压缩处理:

newseq1,newseq2=zip(*zipped)
print(newseq1)
#newseq1=['foo','bar','baz']
print(newseq2)
#newseq2=['one','two','three']

reversed函数:从后向前迭代一个列表。该方法时一个生成器。

字典:python中的哈希映射或关联数组,是键值对的集合,大小可变。键通常为不可变的标量类型,值可以为任意python对象

可以使用del关键字或pop方法删除值
del dic[key]: 删除key键和其对应的值
dic.pop(key):功能同上,返回返回删除的值。
可以用update方法一个字典与另一个字典融合:
d1.update(d2) :将d2中的键值对与d1合并,相同的键,不同的值,由b2覆盖b1的值。

集合 (set)无需的不可重复的元素的集合。

创建方法:

#方法1:
a=set([1,1,2,3,4,5,6,3,4])
print(a)
#a={1,2,3,4,5,6}

方法2:
a={1,2,3,4,4,4,5,6}#两者等价

集合的运算:支持合并、交集、差分、对称差等数据集合运算
合并:取两个集合中不重复的元素,可以用union方法或者|运算符
交集:取两个集合中的相同元素,可以使用intersection或者&运算符

常用方法:

标签:数据分析,python,基础,元素,list,列表,bisect,集合,元组
来源: https://www.cnblogs.com/ifDMY/p/16226978.html