首页 > TAG信息列表 > data-manipulation

python-熊猫在原位应用更新,但不返回任何值

我不了解此套用行为..熊猫套用到位更新但返回无 >>>import pandas as pd >>>df_test = pd.Series({0: {'A', 'E'}, 1: {'A', 'C', 'E', 'S'}, 2: {'A', 

python-如何在数据框某些行的所有列上使用熊猫应用功能

我有一个数据框.我想将某些行的所有列的值替换为默认值.有没有办法通过pandas apply功能做到这一点 这是数据框 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']

检查python字符串格式?

我有一堆字符串,但我只想保留这种格式: x / x / xxxx xx:xx 检查字符串是否符合此格式的最简单方法是什么? (假设我想查看是否有2 /’和’:’)解决方法:尝试定期表达: import re r = re.compile('.*/.*/.*:.*') if r.match('x/x/xxxx xx:xx') is not None: print 'matches' 你可以

Python数据操作:从一列拆分数据以在同一数据帧中生成更多行

所以我的意见是: Col1 Col2 Col3 Col4 0 123 abc,def,ghi Country1 XXX 1 456 pqr,stu Country2 XX 2 789 xyz Country2 YY 我希望我的输出为: Col1 Col2 Col3 Col4 0 abc 123 Country1 XXX 1 def 1

人为地将记录添加到MySQL结果中

有没有办法将记录放到MySQL的结果集顶部?例如,如果我的结果是: 1 | a 2 | b 3 | c etc 我希望能得到: Select | Select 1 | a 2 | b 3 | c etc “Select”实际上不是记录集的一部分,而是人为插入的. 谢谢.解决方法:使用UNION实现此目的的唯一方法是使用UNION: SE

python – 将Dataframe与不同日期合并?

我想将单独的数据帧(df2)与主数据帧(df1)合并,但是如果对于给定的行,df1中的日期不存在于df2中,则在df1中搜索基础日期之前的最近日期. 我尝试使用pd.merge,但它会删除具有不匹配日期的行,并且只保留两个df中匹配的行. df1 = [['2007-01-01','A'], ['2007-01-02','B'],

使用python将邻接列表转换为稀疏邻接矩阵

使用scipy时,我能够以下列格式转换数据: (row, col) (weight) (0, 0) 5 (0, 47) 5 (0, 144) 5 (0, 253) 4 (0, 513) 5 ... (6039, 3107) 5 (6039, 3115) 3 (6039, 3130) 4 (6039, 3132) 2 如何将此变换为具有零的数组或稀疏矩阵以用于缺失权重值? (

python – 数据识别,解析,过滤和转换 – GUI?

寻找一种非基于云的开源应用程序来进行数据转换;虽然对于仅为数据转换而构建的杀手(我的意思是杀手)应用程序,我可能愿意花费高达1000美元. 我看过Perl,Kapow Katalyst,Pentaho Kettle等等. Perl,Python,Ruby显然是语言,但无法找到任何框架/ DSL只是为了处理数据;这意味着他们真的