研究生数学建模一等奖获奖经验分享

建模忠哥 • 2023-12-03 • 数学建模, 经验 • 1148 阅读

来自杭州电子科大的华为杯研究生数学建模E题一等奖得主，请他来分享自己的经验。

数据处理方面：

E题的数据量非常庞大，包括各种各样的附件，每一个附件中又包括了很多特征列，所以在拿到赛题的时候，我们组并没有急于去思考第一问应该建立什么模型、应该用什么方法，而是先读懂每一个附件中的数据代表什么意思，还包括有一些pdf文件，里面也暗藏着很多可用的信息，这是至关重要的。其次要分析数据是否完全正确，是否存在错误的观测，在哪些地方存在缺失等等。倘若存在数据的缺失，我们要想办法将其补齐，最简单的可以用线性插值、取平均等等，倘若跟时间有关，可以采用时间序列预测模型，比如ARIMA等等。当然也可采用更复杂的深度学习，比如LSTM，一维卷积等等，根据小队的实力来确定。如何检查数据是否有错误，可以使用KNN等，使用不同的距离度量方式，找到离群点等。最重要的一点就是要想清楚，针对这个问题，到底应该用哪些数据去进行回归或者分类。

模型的选择：

在选择模型之前，有的同学可能会把所有的自变量等都加入进模型当中，比如构建BP网络。这样也许会有好的效果，但其中不乏有一些对模型的构建没有太大帮助的自变量。所以在构建模型之前，建议先用一些定性分析方法，比如一些相关系数，eg：斯皮尔曼相关系数等。选择合适的自变量是构建模型的第一步。

接下来就是如何选择合适的模型，建议在比赛前可以将一些现成的机器学习、深度学习方法的代码下载下来，在自己的计算机上运行。这样在比赛时会节省不少的时间。将不同方法进行归类。比如机器学习中可以用来进行预测的模型有BP网络、决策树、支持向量机等等。倘若有图片数据，可以采用卷积网络，最简单的莫过于LeNet、AlexNet等等。倘若有文字数据，就面临着NLP问题，可以采用一维卷积或者循环神经网络，当然现有的大模型在做NLP任务时会更有帮助，比如GPT、BERT、T5等等，这些都有预训练模型，可以针对不同的下游任务进行微调，完成特定的任务，但也许需要电脑上有GPU等，否则可能会跑不起来。

模型的检验：

最后就是关于模型的检验，可以在构建模型时，就分出一小部分数据，作为测试集，检测模型的准确率。也可以采用传统的统计方法，如观测R方统计量，MSE等等，都是很好的方法。

文章写作：

文章的写作是最为重要的，选手一定要在比赛前自己阅读文章内容要求，加上必要的引用，参考文献等。字体格式也必须满足评委组的要求，切不可大意。

版权声明：
作者：建模忠哥
链接：http://jianmozhongge.cn/2023/12/03/%e7%a0%94%e7%a9%b6%e7%94%9f%e6%95%b0%e5%ad%a6%e5%bb%ba%e6%a8%a1%e4%b8%80%e7%ad%89%e5%a5%96%e8%8e%b7%e5%a5%96%e7%bb%8f%e9%aa%8c%e5%88%86%e4%ba%ab/
来源：建模忠哥
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

打赏

海报

研究生数学建模一等奖获奖经验分享

来自杭州电子科大的华为杯研究生数学建模E题一等奖得主，请他来分享自己的经验。数据处理方面： E题的数据量非常庞大，包括各种各样的附件，每一个附件中又包……

预测模型——时间序列模型

<<上一篇

论文引言撰写的万能框架！

下一篇>>

文章目录

关闭

搜索内容

研究生数学建模一等奖获奖经验分享

作者信息

近期文章

热门文章

目录

近期文章