12月12日,由教育部学位与研究生教育发展中心主办、重庆大学承办的“华为杯”第十三届全国研究生数学建模竞赛正式落下帷幕。华东师范大学生命医学研究所生物信息学课题组的丁武斌、刘文强、赵金东三位研究生组队参加,获得了本次大赛的一等奖。
全国研究生数学建模竞赛是在全国范围内举行的、面向研究生群体的赛事,2013年被列为教育部“全国研究生创新实践系列活动”主题赛事之一,深受全国研究生的喜爱和欢迎。本次大赛的参赛规模创历史新高,较去年增长39%,研究生培养单位达到456家,参赛团队共计10019支,参赛研究生达3万余名。竞赛题目共有5个,是来源于卫星导航定位、生物遗传基因筛选、物流运输等科学前沿或工程实践的具体问题,要求参赛队伍在4天5夜内完成理论建模、数据验证和论文写作,极具实用性和挑战性。
参赛经历分享
(左)赵金东 (中)丁武斌 (右)刘文强
丁武斌,华东师范大学生命科学学院2015级研究生,研究方向为生物信息学,导师石铁流教授。
另外两个队友都来自生物信息学课题组,分别是刘文强和赵金东。三个人中,有两个本科是生物专业,另外一个是信息专业。我们三个没有参加过类似的竞赛,也没有相关的实战经验,只是在研究生一年级期间,做过一些课题,进而学习了相关的数学知识。再加上之前实验室有师兄师姐在竞赛中获得过好成绩,所以今年就抱着试试看的心态报名了。
也许是初学者的运气,今年的5道题目中,正好有一道是生物题目(具有遗传性疾病和性状的遗传位点分析),这个题目跟生物信息学紧密相关,所以我们毫不犹豫的选择了这道题目。虽说这个题目与专业对口,但在此之前也没有接触过这方面的课题,甚至连这个题目涉及的基本生物学知识也只是一知半解。所以,我们决定首先向师兄请教,学习一些基本知识,同时查阅文献,了解最前沿的研究成果。前后花了近两天的时间查阅文献,最终找到了几篇解决类似问题的英文文献。之后认真阅读文章中提到的模型和方法,综合了不同的方法并对其进行了改进。等模型设计满意之后,就开始写程序来建立模型并对模型进行求解。
竞赛一共只有四天半的时间,因为我们数学能力有限,很难把所有的模型用数学公式描述清楚并用专业术语写出来,所以大部分时间都花在了建立模型上。一直到截止时间的前一天中午,才把所有的模型建好并用程序实现。剩下的时间就是写论文,那天晚上,我们三个人通宵写论文、改论文。直到截止时间的前十分钟,才敲定论文终稿并在网站提交。
最终能拿一等奖,我认为和以下几个因素是分不开的:
第一,团队分工合作至关重要。我们三个人,一个人负责看文献、找模型,一个数学能力较强的人则需要将文献中的数学公式和模型弄清楚并加以改进,另外一个就负责对数据进行预处理和后期程序的编写。最后写论文的时候,每个人把自己负责的模块文章写好,然后将三个人写的内容汇总到一起,反复修改补充,才得到一篇完整的论文。
第二,看文献也是一项很重要的步骤。因为数学建模的比赛题目都是不同领域比较前沿的问题,所以,在拿到题目之后,不能一开始就着急建立模型,首先要查阅文献,看国内外的最新研究进展,因为有些国内外学者已经对不同模型进行了比较,我们只需借鉴文章中的结论,采用一个较好的模型,而不是自己凭直觉随便挑一个模型,等运行出来的结果不理想再换另外一个模型,这样就非常浪费时间。
第三,不能将模型生搬硬套。在建立模型的时候,不能不顾问题的本质而去套用一些不适用的模型。神经网络模型近来比较流行,所以很多同学更倾向于选择神经网络模型来解决问题,但是每个算法和模型都有它们的适用条件,必须要根据实际问题来选择模型。就像这次题目中B题的第二问一样,其实它属于二分类问题,可以选择逻辑斯蒂模型而不是神经网络模型进行求解。
丁武斌获得第十三届“华为杯”全国研究生数学建模竞赛一等奖
此外,我们也总结出了一些不足之处:
首先,论文书写有小纰漏。比赛结束之后再次翻阅所写的论文的时候,发现了很多错别字和错误,也包括代码上的小错误。虽然比赛时间有限,还熬夜写论文,难免会出现很多纰漏,但仍然后悔当初没有预留一部分时间对论文进行检查。
其次,专业是长板,数学能力是短板。在交流会上,听了来自全国各地、不同专业背景团队的报告,也与命题专家进行了交流,意识到了自身存在的不足:与其它学校数学专业或者计算机、统计专业的团队相比,数学能力较弱,之所以能获得比他们高的分数,是因为我们的专业(生物信息学)优势。
参加全国研究生数学建模竞赛是一次难忘的经历,在有限的时间内,三个人为了一个目标共同奋斗,熬夜至天明,这种过程让我非常享受。在短短的四天半时间内,在查阅资料、向师兄请教以及相互交流的过程中,学到了很多知识,而且这些知识是平时花几倍时间都很难学到的。最后感谢数学建模组委会和学校,为我们提供了这个平台,也感谢实验室大家庭的帮助与指导。