Python和Pandas – dp.Series int32和int64之间的区别
作者:互联网
我开始学习python,numpy和panda,我有一个非常基本的问题,关于大小.
请参阅下一个代码块:
1.长度:6,dtype:int64
# create a Series from a dict
pd.Series({key: value for key, value in zip('abcdef', range(6))})
与
2.长度:6,dtype:int32
# but why does this generate a smaller integer size???
pd.Series(range(6), index=list('abcdef'))
题
所以我认为当你在pd.Series中放置一个列表,numpy数组,字典等时你会得到int64但是当你在pd.Series中只放置范围(6)时你会得到int32.有人可以让我对我有点清楚吗?
对不起,这个非常基本的问题.
@Edit:我正在使用Pandas版本0.20.1和Numpy 1.12.1
解决方法:
它们在语义上是不同的,因为在第一个版本中,您传递带有单个标量值的dict,因此dtype变为int64,对于第二个版本,您传递的范围可以简单地转换为numpy数组,这是int32:
In[57]:
np.array(range(6)).dtype
Out[57]: dtype('int32')
所以pandas系列的构造在第一个实例中包含一个dtype匹配而在第二个实例中没有,因为它可以转换为numpy数组,而numpy确定在这种情况下首选int32
更新
看起来这取决于你的numpy版本和pandas版本.
我正在运行python 3.6,numpy 1.12.1和pandas 0.20.3,我得到了上面的结果.我也在运行Windows 7 64位
@jeremycg运行pandas 0.19.2和numpy 1.11.2并观察到相同的结果,而@coldspeed运行numpy 1.13.1并观察int64.
从中可以看出,dtype很大程度上取决于numpy的作用.
我相信在这种情况下,当我们通过范围时,这个line就是所谓的.
subarr = np.array(arr, dtype=object, copy=copy)
返回的类型由numpy和OS决定,在我的例子中,windows将C Long定义为32位.见相关:numpy array dtype is coming as int32 by default in a windows 10 64 bit machine
标签:python,pandas,numpy,data-analysis 来源: https://codeday.me/bug/20190622/1264139.html