编程语言
首页 > 编程语言> > Python和Pandas – dp.Series int32和int64之间的区别

Python和Pandas – dp.Series int32和int64之间的区别

作者:互联网

我开始学习python,numpy和panda,我有一个非常基本的问题,关于大小.

请参阅下一个代码块:

1.长度:6,dtype:int64

# create a Series from a dict
pd.Series({key: value for key, value in zip('abcdef', range(6))})

2.长度:6,dtype:int32

# but why does this generate a smaller integer size???
pd.Series(range(6), index=list('abcdef'))


所以我认为当你在pd.Series中放置一个列表,numpy数组,字典等时你会得到int64但是当你在pd.Series中只放置范围(6)时你会得到int32.有人可以让我对我有点清楚吗?

对不起,这个非常基本的问题.

@Edit:我正在使用Pandas版本0.20.1和Numpy 1.12.1

解决方法:

它们在语义上是不同的,因为在第一个版本中,您传递带有单个标量值的dict,因此dtype变为int64,对于第二个版本,您传递的范围可以简单地转换为numpy数组,这是int32:

In[57]:
np.array(range(6)).dtype

Out[57]: dtype('int32')

所以pandas系列的构造在第一个实例中包含一个dtype匹配而在第二个实例中没有,因为它可以转换为numpy数组,而numpy确定在这种情况下首选int32

更新

看起来这取决于你的numpy版本和pandas版本.
我正在运行python 3.6,numpy 1.12.1和pandas 0.20.3,我得到了上面的结果.我也在运行Windows 7 64位

@jeremycg运行pandas 0.19.2和numpy 1.11.2并观察到相同的结果,而@coldspeed运行numpy 1.13.1并观察int64.

从中可以看出,dtype很大程度上取决于numpy的作用.

我相信在这种情况下,当我们通过范围时,这个line就是所谓的.

subarr = np.array(arr, dtype=object, copy=copy)

返回的类型由numpy和OS决定,在我的例子中,windows将C Long定义为32位.见相关:numpy array dtype is coming as int32 by default in a windows 10 64 bit machine

标签:python,pandas,numpy,data-analysis
来源: https://codeday.me/bug/20190622/1264139.html