首页 > TAG信息列表 > multi-index

python-用Multiindex列和不规则的时间戳连接Pandas DataFrames

我在列表中有很多单独的数据框,每个数据框都有多索引列,并且是针对不同时间段和长度的时间序列.我想做三件事: >汇集所有单独的数据框>任何具有相同多索引列的数据框都会追加和排序沿时间轴>具有不同多索引列的数据框将并置列轴(轴= 1) 我知道默认情况下,`pandas.concat(objs,axis =

python-将多索引DataFrame的行合并为逗号分隔的列表

给定一个多索引DataFrame,我想组合重复的索引对并将其值列出为逗号分隔的列表.例如,输入: df = pd.DataFrame({'Last Name' : ['Deere','Deere','Foo' ,'Foo' ,'Man' ], 'First Name': ['John' ,'

python-使用句号选择/切片多索引数据帧时间序列会导致错误?

我有一个多级索引,它的一级索引是一个时间序列,与下面的索引非常相似: In[168]: rng = pd.date_range('01-01-2000',periods=50,freq='M') In[169]: long_df = pd.DataFrame(np.random.randn(50,4),index = rng, columns=['bar','baz','foo','zoo&#

python-通过multiIndex之一的最高分位数过滤数据帧行

我有一个带有multiIndex的数据框,我只想保留其列值在级别0索引的最高分位数中的子集记录. 在以下示例df中,我想保留其列A值在每个级别0索引的最高分位数为75%的记录. pythonic的做事方式是什么? arrays = [np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qu

重新索引MultiIndex数据框的特定级别

我有一个带有两个索引的DataFrame,并希望通过其中一个索引对其进行重新索引. from pandas_datareader import data import matplotlib.pyplot as plt import pandas as pd # Instruments to download tickers = ['AAPL'] # Online source one should use data_source = 'yahoo'

python-根据0级索引对多索引Pandas DataFrame的1级索引进行自定义排序

我有一个multindex DataFrame,df: arrays = [['bar', 'bar', 'baz', 'baz', 'baz', 'baz', 'foo', 'foo'], ['one', 'two', 'one', 'two',

python-使用.loc访问多索引数据框时如何保留列顺序?

让我们得到以下具有多索引列的数据框 import numpy as np import pandas as pd a = ['i', 'ii'] b = list('abc') mi = pd.MultiIndex.from_product([a,b]) df = pd.DataFrame(np.arange(100,100+len(mi)*3).reshape([-1,len(mi)]), colum

python-行中的熊猫层次结构索引

我认为这应该是一个小问题,但是我无法找到解决方案. 假设您有以下DF pd.DataFrame({'Math_0':[1,2,6,'math'],'Math_1':[8,3,7,'math'],'science_0':[9,5,2,'science']}, index=['Jeff','Bob','Cal�

python-在NumPy中跟踪多索引和修改值

我正在迭代一个2D数组,以使用索引值进行计算,然后将计算出的值分配给所述索引. 在NumPy文档中,提供了an example用于使用迭代器修改值: for x in np.nditer(a, op_flags=['readwrite']): x[...] = 2 * x 但是,当使用the following method跟踪索引时,这似乎不起作用: it = np.n

python-熊猫多索引排序特定字段

通过为组合的数据帧运行series.describe(),我在熊猫中获得了一个多索引. 如何按modelName.mean对这些系列进行排序,并且仅保留单独的字段? 这个 summary.sortlevel(1)['kappa'] 对它们进行排序,但保留所有其他字段(如count).我怎样才能保持均值和标准差? 编辑 这是df的文字表示.

python – 将DataFrame列标题设置为MultiIndex

如何将具有单级列的现有数据框转换为具有分层索引列(MultiIndex)? 示例数据帧: In [1]: import pandas as pd from pandas import Series, DataFrame df = DataFrame(np.arange(6).reshape((2,3)), index=['A','B'], columns=['one','t

python – 在Pandas中使用multiIndexing时显示所有索引值

我希望在查看我的DataFrame时,我会看到multiIndex的所有值,包括后续行对其中一个级别具有相同索引的时间.这是一个例子: arrays = [['20', '50', '20', '20'],['N/A', 'N/A', '10', '30']] tuples = list(zip(*arrays)) index = pd.Mult

python – 按索引选择MultiIndex数据框中的行而不会丢失任何级别

我想选择一个名为’Mid’的行,而不会丢失它的索引’Site’ 以下代码显示了数据帧: m.commodity price max maxperstep Site Commodity Type Mid Biomass Stock 6.0 inf inf CO2 Env 0.0 inf inf C

python – Pandas:修改特定级别的Multiindex

我有一个带有Multiindex的数据框,想要修改Multiindex的一个特定级别.例如,第一级可能是字符串,我可能想要从该索引级别删除空格: df.index.levels[1] = [x.replace(' ', '') for x in df.index.levels[1]] 但是,上面的代码会导致错误: TypeError: 'FrozenList' does not support m

python – 熊猫:获得多指数级别的系列

我有一个包含多个级别的数据框,例如: idx = pd.MultiIndex.from_product((['foo', 'bar'], ['one', 'five', 'three' 'four']), names=['first', 'second']) df = pd.Dat

python – 将MultiIndex数据帧重塑为表格格式

给出一个MultiIndex示例: idx = pd.MultiIndex.from_product([[0, 1, 2], ['a', 'b', 'c', 'd']]) df = pd.DataFrame({'value' : np.arange(12)}, index=idx) df value 0 a 0 b 1 c 2 d

python – 具有多索引列的Pandas数据框 – 合并级别

我有一个数据框,分组,多指数列如下: import pandas as pd codes = ["one","two","three"]; colours = ["black", "white"]; textures = ["soft", "hard"]; N= 100 # length of the dataframe df = pd.DataFrame({ &#

python – 填写MultiIndex Pandas Dataframe中的日期空白

我想修改一个pandas MultiIndex DataFrame,使每个索引组包含指定范围之间的日期.我希望每个小组用值0(或NaN)填写2013-06-11到2013-12-31的缺失日期. Group A, Group B, Date, Value loc_a group_a 2013-06-11 22 2013-07-02 35

python – pandas:使用.loc和MultiIndex进行条件选择

我已经阅读了Advanced indexing with hierarchical index的文档,其中解释了使用.loc for MultiIndex.也是这个帖子:Using .loc with a MultiIndex in pandas? 我仍然没有看到如何选择行(第一个索引==某个值)或(第二个索引==某个值) 例: import pandas as pd index = pd.MultiIndex.

python – Pandas MultiIndex(超过2个级别)DataFrame到嵌套Dict / JSON

这个问题类似于this one,但我想更进一步.是否有可能将解决方案扩展到更高级别的工作?多级数据帧’.to_dict()方法有一些很有前景的选项,但是大多数都会返回由元组索引的条目(即(A,0,0):274.0),而不是将它们嵌套在字典中. 有关我要完成的示例,请考虑此多索引数据框: data = {0: {

如何在pandas.multiindex的级别上应用条件?

我的数据看起来像这样(ch = channel,det = detector): ch det time counts 1 1 0 123 2 0 121 3 0 125 2 1 0 212 2 0 210 3 0 210 1 1 1 124 2 1 125 3 1 123 2 1 1 210 2

python – 从pandas dataframe index创建列

我有一个数据框,我想将(索引的第一级)数据转换为一列.实际上我的df看起来像这样: col1 CoI AK 0 1 1 31 2 NaN BB 0 5 1 31 2 NaN 我想把它变成这样: col1 CoI 0 1 AK 1 31 AK 2

python – MultiIndex查找具有给定级别给定值的所有索引

我正在使用带有MultiIndex的pandas.Series进行双向加权查找.我认为使用MultiIndex找到给定级别的相应其他级别应该很容易,但我找不到其他类似以下内容的简单函数: >>> index=pandas.MultiIndex.from_tuples( ... [(0, 0),(1,2),(3,4),(5,6),(5,7),(8,0),(9,0)], .

python – Pandas:如何分组并对MultiIndex求和

我有一个带有分类属性的数据框,其中索引包含重复项.我试图找到索引和属性的每个可能组合的总和. x = pd.DataFrame({'x':[1,1,3,3],'y':[3,3,5,5]},index=[11,11,12,12]) y = x.stack() print(y) print(y.groupby(level=[0,1]).sum()) 产量 11 x 1 y 3 x 1

Python Pandas:如何设置multiindex的名称?

我想添加多索引数据帧的索引名称. 我想将图片中的红框名称设置为“Ticker” 我怎样才能做到这一点?解决方法:设置index.names(复数,因为MultiIndex)或使用rename_axis: df.index.names = ['Ticker','date'] #if want extract second name df.index.names = ['Ticker',df.index.nam