【自我解析】2020华为杯数学建模比赛C题
作者:互联网
C题相较于A题专业性不是那么强,更偏向对给出数据的处理。这里我看了三篇优秀论文进行此题的学习,分别为0319(同济)、0034(上海理工)、0095(上海交通)。
题目提供两个数据附件、P300的介绍、睡眠过程。
问题一:
0319对于问题一的分析:
0034对于问题一的分析:
可以发现基本为以下流程 :
在这里我觉得涉及从大量数据中分析得到结果的题目都可以按此流程。在对训练集的数据处理时多为以下流程:
其中0319使用了去趋势、滤波和不平衡样本的重采样,0034采用了切片、滤波、下采样等。都是对数据的预处理。
接着在模型建立的时候大家基本都使用了以下模型:
三篇都在进行模型建立后得出待识别目标预测结果(可见结果是确定的QAQ)。
问题二:
问题二中各篇使用的方法都不同。其中0319是通过对数据的训练和分析后得出一个最优通道名称组合;以此通道为输入,对所有模型进行训练。得出问题答案。0034则使用主成分分析法,简化变量间互相关联的复杂关系。降维去噪。
以上为主成分分析法求解过程。
0095则使用注意力机制模型。此模型的引入可以使得神经网络具备专注于其输入(或特征)子集的能力,也即能够从多个输入中优先选择特定的输入。
其原理在此不再赘述,0095文中很清楚。
问题三:
基于问题一与二找到一种学习方法。
0319采用半监督学习(CNN)
0034也是半监督学习(SVN)0095也一样。
这里可以看出问题三发挥不大,大家都使用的是半监督。我估计在进行优秀样本采集或者减少训练时间大都会采用半监督模型。
问题四
0034分析如下:
三篇大致意思都为对数据进行预处理、特征构造、抽取训练数据、建立各种模型对比准确率指标性能。与问题一差别不大。
个人认为本题比起A题来说是简单的,如果有对数据处理等的学习估计会更加游刃有余。
标签:0034,模型,建模,问题,华为,2020,0319,0095,数据 来源: https://blog.csdn.net/qq_40382325/article/details/120183084