编程语言
首页 > 编程语言> > 双节棍「大师」鱼佬亲传武功秘籍:如何进行一场数据挖掘算法竞赛?

双节棍「大师」鱼佬亲传武功秘籍:如何进行一场数据挖掘算法竞赛?

作者:互联网

当我们掌握了一定的机器学习和数据挖掘基础理论后,参加一场数据算法竞赛可以接触真实的业务和数据,将理论知识过渡到工程应用,同时可以在竞赛过程中进行反复地思考,强化对理论知识的理解。


本次分享,我将以个人竞赛经历和圈内整体情况为背景和大家聊聊如何进行一场数据挖掘算法竞赛,以及赛前、赛中和赛后需要做哪些事情。最后还将进行一个案例分享,来看看我是如何进行一场比赛的。


注:本文详细视频 晚7点在阿里天池分享,链接可回看

https://tianchi.aliyun.com/course/live?liveId=41153


主题大纲

  1. 为什么要参加数据挖掘竞赛?能带来什么?

  2. 参加竞赛需要哪些基础知识和技能?

  3. 如何选择适合自己的竞赛?

  4. 竞赛中的几个主要模块议

  5. 竞赛过程中最重要的事情

  6. 好的竞赛总结比竞赛过程更重要

  7. 案例分享( 天池“全国城市计算AI挑战赛”)


为什么要参加数据挖掘竞赛?

图片


参加竞赛需要的基础知识和技能?

图片



如何选择适合自己的竞赛?




竞赛中的几个主要模块

竞赛中主要包含:赛题理解、问题建模、数据分析、数据清洗、特征工程、模型训练、模型验证、模型预测、模型融合等几个模块。

图片


Step 1:问题建模

图片


图片




Step 2:数据探索性分析

图片


图片


Step 3:特征工程

图片


图片







图片


图片


Step 4:必备模型,对XGBoost、LightGBM模型有深入的了解

图片


Step 5:模型融合

图片


竞赛过程中最重要的事情

在比赛过程中,需要进行海量数据分析、不断尝试新的idea,并且多向优秀的选手学习


好的竞赛总结比竞赛过程更重要

赛后及时作总结并学习优秀方案,是帮助提升竞赛能力的最佳方式

图片


案例分享

以天池竞赛社区-全球城市计算AI挑战赛为例,分析如何走完一个数据挖掘竞赛的流程

图片


图片


图片


图片


图片


标签:竞赛,数据,模型,Step,理论知识,数据挖掘,鱼佬亲,双节棍
来源: https://blog.51cto.com/15080014/2619993