第三届泰迪杯技能赛赛后分享总结
作者:互联网
第三届泰迪杯技能赛赛后分享总结
今天泰迪杯官方公布了第三届泰迪杯技能赛的获奖情况,我的小组A题获得了二等奖,B题获得了一等奖。作为第一次参加这个比赛的小白,还是感到比较幸运的。下面就来复盘一下这次的比赛和分享一下做题经历。
对本次竞赛的一些看法
通过这次的比赛,我感觉参赛方主要考察的是大家利用各种工具解决问题的能力,毕竟一道题目的时间限制为12个小时,大家不必把问题太过复杂化,感觉自己用Excel解决这个问题更顺手就用Excel,用python画图简单就用python,主要是能在规定时间内得到一个较好的答案,无论哪一步都可以做的比较简单,包括最后的提交报告,虽然是非常重要的一环,但是不用写的过于复杂,主要是表达清晰,可以看做是一个很简化的数学建模论文。
泰迪杯技能赛分为A,B两道题目。因为竞赛的颁奖是按照报名人数*比例颁奖,所以建议参赛的同学也最好把两道题都做了,这样获奖概率会大很多。
今年的A题难度明显要高于B题,我们组在做A题的时候也遇到了很多的困难,尤其是任务3需要用到一些特定的算法,由于种种原因,到晚上7点(8点截止)我们也没有得到一个比较好的结果,由于对时间的把控失误,最后剩给我们写报告和整理支撑材料的时间只剩下了40分钟。着急提交了论文之后觉得获奖无望,于是我们毅然决定在第二题继续做B题。最后很幸运两道题目均有获奖。
B题复盘
由于当时做A题的时候草草结尾,时间过去一个多月很多记忆和比赛资料也都丢失了,这里就只能给大家复盘一下B题。
B题的背景是当下世界最关心的话题:新冠疫情。简单分析题目之后解题重点就尤为突出:处理数据、可视化。
当然这也正是这类比赛的考察重点。大多数这类比赛的前期数据处理都较为复杂,这次竞赛的A题也是如此,但是这次的B题不一样,队友利用pandas对数据进行清洗查看后,发现数据并无异常,唯有在“A 市涉疫场所”表中出现一行重复数据,猜测是因为在同一天的同一地点报告了两例病例,故 视为正常数据。因此,我们直接着手对数据进行分析和处理。任务1.1-1.3偏向于一个定解问题,利用python中的group by函数可以进行处理,其中任务1.3需要对该日住院人数进行定义,然后将问题的结果做成表格展示在报告中。
任务1.4有一个需要注意的点在于:第六天具有传播性且未被收治的感染者,应为第七天和八天被通报的确诊者,第十天具有传播性且未被收治的感染者,应为第十一天和十二天被通报的确诊者。只要理解了这个点,剩下的就很简单了,把对应的确诊者的坐标找到,然后作图画出,这里作图还是尽量以简洁美观为要点。下面展示第十天疫情传播风险区域图:
到这里任务1就圆满解决了,大家可以看出任务1的解决是相对简单的,我认为任务1要点就是完成度要高,结果展示清晰,分析合理。
对于任务2,这里就不得不提到竞赛方提供的一个可以用于可视化大屏制作的BI平台。我们小组的任务2就是在第一题处理的数据基础上,完全依赖于BI平台制作的可视化大屏。(竞赛方的意思是可以使用任何软件工具,但是他都已经提供了这么一个平台,我大胆猜测当然是用这个比较好)
制作可视化大屏的基本框架是来源于赛前培训的汽车销售大屏。内容方面是参考丁香医生的表达内容。
相关的分析也就是完全照着可视化大屏的内容,有什么说什么。
任务3就相对比较开放,需要对疫情发展阶段进行划分,为了对世界不同地区在不同阶段的标志参数的特点进行分析,我们定义了新冠疫情标志性参数:
后面的工作就是根据这些指标,进行数据的处理,数据的可视化,然后根据可视化结果进行简单分析。下面是在Jupyter Notebook 上做的图:
关于报告写作
报告的写作一定是很重要的一点,因为无论你过程做的多好,评委也能看到你提交的报告,所以真正决定你获奖高低的一定是报告中体现的内容。
报告一定要从比赛一开始就写,和数学建模一样,可以有一个同学专门负责记录整理大家的思路和撰写报告,报告不需要太复杂,我认为报告一定是在能完整表达出自己的结果和内容的基础上,以清晰简洁为重。下面是我们组报告的目录:
问题重述、任务假设、任务解决三点足矣表达清楚整个解题流程和思想。
最重要的部分可能就在于数据可视化,俗话说一图胜千文,其实我们组的可视化部分也不是特别精美,还有很多值得改进的地方,大家在写报告的时候多多插入能表达结果或思考内容的表格、可视化图片或是流程图,对于整个报告的质量提升还是会有很大帮助的。
标签:泰迪杯,比赛,报告,第三届,任务,可视化,大屏,赛后 来源: https://blog.csdn.net/weixin_45948355/article/details/111230414