研究生数学建模一等奖获奖经验分享

来自杭州电子科大的华为杯研究生数学建模E题一等奖得主,请他来分享自己的经验。

数据处理方面:

E题的数据量非常庞大,包括各种各样的附件,每一个附件中又包括了很多特征列,所以在拿到赛题的时候,我们组并没有急于去思考第一问应该建立什么模型、应该用什么方法,而是先读懂每一个附件中的数据代表什么意思,还包括有一些pdf文件,里面也暗藏着很多可用的信息,这是至关重要的。其次要分析数据是否完全正确,是否存在错误的观测,在哪些地方存在缺失等等。倘若存在数据的缺失,我们要想办法将其补齐,最简单的可以用线性插值、取平均等等,倘若跟时间有关,可以采用时间序列预测模型,比如ARIMA等等。当然也可采用更复杂的深度学习,比如LSTM,一维卷积等等,根据小队的实力来确定。如何检查数据是否有错误,可以使用KNN等,使用不同的距离度量方式,找到离群点等。最重要的一点就是要想清楚,针对这个问题,到底应该用哪些数据去进行回归或者分类。

模型的选择:

在选择模型之前,有的同学可能会把所有的自变量等都加入进模型当中,比如构建BP网络。这样也许会有好的效果,但其中不乏有一些对模型的构建没有太大帮助的自变量。所以在构建模型之前,建议先用一些定性分析方法,比如一些相关系数,eg:斯皮尔曼相关系数等。选择合适的自变量是构建模型的第一步。

接下来就是如何选择合适的模型,建议在比赛前可以将一些现成的机器学习、深度学习方法的代码下载下来,在自己的计算机上运行。这样在比赛时会节省不少的时间。将不同方法进行归类。比如机器学习中可以用来进行预测的模型有BP网络、决策树、支持向量机等等。倘若有图片数据,可以采用卷积网络,最简单的莫过于LeNet、AlexNet等等。倘若有文字数据,就面临着NLP问题,可以采用一维卷积或者循环神经网络,当然现有的大模型在做NLP任务时会更有帮助,比如GPT、BERT、T5等等,这些都有预训练模型,可以针对不同的下游任务进行微调,完成特定的任务,但也许需要电脑上有GPU等,否则可能会跑不起来。

模型的检验:

最后就是关于模型的检验,可以在构建模型时,就分出一小部分数据,作为测试集,检测模型的准确率。也可以采用传统的统计方法,如观测R方统计量,MSE等等,都是很好的方法。

文章写作:

文章的写作是最为重要的,选手一定要在比赛前自己阅读文章内容要求,加上必要的引用,参考文献等。字体格式也必须满足评委组的要求,切不可大意。

版权声明:
作者:建模忠哥
链接:http://jianmozhongge.cn/2023/12/03/%e7%a0%94%e7%a9%b6%e7%94%9f%e6%95%b0%e5%ad%a6%e5%bb%ba%e6%a8%a1%e4%b8%80%e7%ad%89%e5%a5%96%e8%8e%b7%e5%a5%96%e7%bb%8f%e9%aa%8c%e5%88%86%e4%ba%ab/
来源:建模忠哥
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
研究生数学建模一等奖获奖经验分享
来自杭州电子科大的华为杯研究生数学建模E题一等奖得主,请他来分享自己的经验。 数据处理方面: E题的数据量非常庞大,包括各种各样的附件,每一个附件中又包……
<<上一篇
下一篇>>
文章目录
关闭
目 录