关于开展2022年四川省大学生数据科学与统计建模竞赛的通知

时间:2022-09-30    统计学院     阅读:

为进一步培养学生创新精神和实践能力,鼓励学生运用统计学模型、机器学习模型等数据科学专业知识,协助解决经济社会领域中的实际问题,由四川省教育厅主办,3308维多利亚线路检测中心与四川新网银行承办,四川省普通本科高等学校统计学类专业教学指导委员会、四川省统计学会协办的2022年四川省大学生数据科学与统计建模竞赛正式启动,现将有关事项通知如下:

一、主题

数字科技 创领未来

二、举办单位

主办:四川省教育厅

承办:3308维多利亚线路检测中心 新网银行

协办:四川省普通本科高等学校统计学类专业教学指导委员会、四川省统计学会、字节跳动

三、大赛内容

1.本科生赛道A题目:小微风控算法大赛-早期风险识别

赛题介绍:本赛道需要选手基于所提供的数据构建模型准确预测小微客户早期风险,数据既包含经过脱敏处理的小微企业法人基本信息、历史借贷信息、申请行为信息、工商司法信息以及贷款申请后的早期风险表现数据,期望选手开发模型,对客户早期风险进行识别,帮助金融机构进一步提升模型在小微企业信贷风控中的信用风险识别和防范能力。

2.研究生赛道B题目:小微风控算法大赛-长期风险识别

赛题介绍:本赛道需要选手基于所提供的数据构建模型准确预测小微客户长期风险,数据既包含经过脱敏处理的小微企业法人基本信息、历史借贷信息、申请行为信息、工商司法信息以及贷款申请后的长期风险表现数据,其中部分数据提供了更细颗粒度的数据记录,并提供了小微以外其他产品的样本,期望选手充分挖掘和探索,开发模型对小微客户长期风险进行识别,帮助金融机构进一步提升模型在小微企业信贷风控中的信用风险识别和防范能力。

四、参赛对象

全国在校大学生(本科、硕士/博士生)均可按对应赛道报名参加,本科生仅能参加本科生赛道A,硕士/博士生仅能参加研究生赛道B。每支队伍由不超过4名参赛选手及1名指导老师组成,指导老师必须是参赛选手所属院校在职教师,1名学生至多加入一支队伍,鼓励同学们跨学校、跨年级、跨专业组队参赛。

五、参赛流程

1.报名(即日-11月2日)

报名方式:参赛选手于报名规定时间内在DataCastle大数据竞赛平台完成注册和报名。

赛道A(电脑端):小微风控算法大赛-早期风险识别 https://challenge.datacastle.cn/v3/cmptDetail.html?id=745

赛道B(电脑端):小微风控算法大赛-长期风险识别 https://challenge.datacastle.cn/v3/cmptDetail.html?id=746

2.初赛(即日-11月8日)

(2)初赛于DataCastle线上进行,选手需在DataCastle下载数据,在本地进行算法调试,并在DataCastle提交结果,提交数据文件为 .csv格式,utf-8编码。

(2)客观提交分公榜、私榜两部分,公榜成绩将在每次完成提交后计入评分系统并及时出分。每天成功提交次数上限5次,提交文件格式错误将不计入当日成功提交次数内。私榜成绩将在团队选择提交公榜文件后(如未选择,则系统默认选取公榜最优成绩文件+最后一次提交文件提交至私榜),公榜截止后公布私榜排名。

公榜客观提交时间为即日至2022-11-08 17:00:00;

私榜选择文件时间为2022-11-07 17:00:00至2022-11-08 17:00:00。

3.复赛(11月15日-11月19日)

(1)各赛道私榜排名前20名参赛团队进入复赛,进入复赛的队伍需在2022年11月14日24:00前提交选手身份证明材料和主观评审材料。

(2)主观评审材料。进入复赛的队伍需提交与私榜出分情况相同的模型和研究报告(包括报告正文、编程源代码)至组委会邮箱。报告文件夹名为:队号-队长姓名-比赛阶段(第X队-张三-复赛),组委会提供报告固定格式。

(3)报告正文统一为word或pdf格式,可附其余支撑材料。所有提交材料请打包压缩成zip格式,压缩包大小不超过300MB,压缩包命名格式为:队号-队长姓名-比赛阶段。

(4)组织专家进行线上评审,各赛道选拔5支队伍进入决赛。

(5)组委会将于11月19日公布进入决赛的队伍名单。

4.决赛(11月27日)

(1)各团队根据各自指导教师意见完善研究报告,并在2022年11月23日24:00之前将修改后的电子版研究报告提交到组委会邮箱。报告文件夹名为:队号-队长姓名-比赛阶段(第X队-张三-决赛)。

(2)决赛以答辩的形式开展,答辩主要包括对研究报告的陈述和答疑两个环节,团队推选1名队员进行研究报告的陈述。专家、观众提问,参赛选手答疑。

(3)决赛时间:2022年11月27日。

六、评分规则

1.初赛成绩评定

根据初始最终私榜队伍排名(AUC)换算成绩,换算公式如下:

初赛评分 = MAX(100 - 初赛评分排名,0)

初赛设置公私榜,初赛结束后线上排名由公榜切换为私榜排名。

2.复赛成绩评定

复赛评分 = 80%* MAX(100 - 初赛评分排名,0) + 20%*主观评审成绩

其中:主观评审成绩总分100,包含以下维度:报告完整性(20%) ,代码规范性(20%) ,问题分析和探索(30%),方案创新性(30%) ,每项维度打分,分为5个档次,优秀90-100分,良好80-89分,中等70-79分,及格60-69分,不合格 60分以下。

3.决赛成绩评定

决赛评分 = 60%*复赛成绩 + 40%*答辩成绩

答辩成绩总分100,评价维度如下:现场陈述(20%) ,现场问答(20%),问题分析和探索(30%),方案创新性(30%) ,每项维度打分,分为5个档次,优秀90-100分,良好80-89分,中等70-79分,及格60-69分,不合格60分以下。

七、参赛奖励

1.以进入复赛的各赛道有效队伍为基数,设置奖项如下:

一等奖:10%/赛道

二等奖:20%/赛道

三等奖:30%/赛道

2.进入决赛答辩的队伍将角逐由新网银行提供的竞赛奖金(税前):

数据菁英奖:12,000元,1队/赛道

数据英才奖:6,000元,2队/赛道

数据人才奖:3,000元,2队/赛道

3.各获奖队伍将获得证书及奖金,数据菁英奖、数据英才奖队伍的指导教师获得优秀指导教师证书。证书由承办单位盖章,四川省教育厅发布获奖通知。

八、联系方式

统计学院办公室:王老师 吴老师 何老师

联系电话:028-87092272 028-87092207 028-87092018

杨荐文(本科生赛道学生负责人):17313296231

本科生赛道QQ交流群:654636886

康璐(研究生赛道学生负责人):17318907031

研究生赛道QQ交流群:110435951

组委会邮箱:stat@swufe.edu.cn


四川省大学生数据科学与统计建模竞赛组委会

二○二二年九月三十日