首页 > TAG信息列表 > dataDF

Python数据清洗见闻

事情是这样的:作为大数据专业学生,有一天老师突然给出了2个多G的csv文件。没做具体任务要求,算是拿着玩。   第一个问题:各种常用文档编辑器都打不开这么大的文件 解决:使用Emeditor,支持文本分段打开,我愿称之为绝活。   第二个问题:对于数据实现简单清洗            描述:老师给

数据分析

数据分析的目的: 以医院销售数据为例,目的是了解朝阳医院在2018年里的销售情况,通过对朝阳区医院的药品销售数据的分析,了解朝阳医院的患者的月均消费次数,月均消费金额、客单价以及消费趋势、需求量前几位的药品等。 数据分析基本过程包括:获取数据、数据清洗、构建模型、数据可视化以

数据分析常用的方法总结

医院销售数据分析案例关键知识点 读取 data = pd.read_excel('chao.xlsx',dtype='object') 为了防止数据类型不一致,先统一用object类型导入 重新给列命名 dataDF.rename(columns={"购药时间": "销售时间"}, inplace=True) 数据类型转换 dataDF["销售数量"] = dataDF["销售数量"].

python数据处理

# 读取数据(最好使用 object 类型读取)读取的时候用object读取,防止有些数据读不了: data = pd.read_excel("朝阳医院2018年销售数据.xlsx", dtype="object")   # 修改为 DataFrame 格式 dataDF = pd.DataFrame(data)     # 查看数据的形状,即几行几列 dataDF.shape # 查看索引 data