【数据分析&数据挖掘】相关性计算
作者:互联网
1 import pandas as pd 2 3 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 4 # print("detail: \n", detail) 5 print("detail的列名称: \n", detail.columns) 6 7 # corr 8 print("相关系数为: \n", detail.loc[:, ["counts", "amounts"]].corr()) 9 print("spearman相关系数为: \n", detail.loc[:, ["counts", "amounts"]].corr(method="spearman")) 10 print("kendall相关系数为: \n", detail.loc[:, ["counts", "amounts"]].corr(method="kendall")) 11 12 # data = detail.loc[:, ["detail_id", "order_id", "dishes_id", "counts", "amounts"]]
# 完整的机器学习算法流程
# 1、导包
# 2、加载数据
# 3、筛选出有用的列
# 4、检测并处理缺失值
# 5、处理异常值
# 6、数据标准化
# 7、构建算法模型进行运算
# 8、算法结果展示---数据可视化
# 9、结论
# 纯数据分析
# 1、导包
# 2、加载数据
# 3、筛选有用的数据
# 4、检测并处理缺失值
# 5、处理异常值
# 6、结果可视化--数据分布、走势的可视化
# 7、书写结论---非常重要
标签:数据分析,loc,amounts,detail,print,相关性,corr,数据挖掘,counts 来源: https://www.cnblogs.com/Tree0108/p/12116132.html