大赛简介
阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。
本次比赛的目的是让广大的高校同学在大数据时代的背景下,有机会学习和利用阿里巴巴的大数据和云计算平台,尝试解决真实的业务与社会问题。
整个比赛分为三季(season):
Season 1:2014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。
Season 2:2014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用MapReduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。
Season 3(即线上赛,实战双11):2014年10月至11月,Season 2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。
报名规则
参赛对象
全日制高校(研究院所)本科、硕士、博士均可参赛
组队规则
参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人(可以跨学院跨学校)。如果是多人团队,则需指定一名队长,负责沟通事宜。另外每个队伍可以配备指导老师一名。
注:
1. 每人只能参加一支队伍;
2. 保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励;
3. 进入season2后,不允许变更队伍成员;
4. 报名时间:只要在4月20日0:00(season1截止)之前报名即可。鼓励大家早点报名,可以早点接触到数据,以确保参赛时间充足;
5. 报名方式:官网注册账号后报名即可;
6. 交流论坛:http://bbs.aliyun.com/thread/187.html?type=738
赛制安排
环节 时间 规则
Season 1 3月10日—4月20日
利用可下载的少量天猫数据,建模与提交结果。
每天提供1次算法提交机会(提交截止时间为每天凌晨2点),隔天公布排行榜,
按照F1分从高到低排序;
4.20日选出第一赛季最好成绩排名在前500名的队伍进入第二赛季;
Season 2 4月25日-7月30日
参赛者需登录阿里巴巴天池平台,访问海量天猫数据。利用天池平台的集成工具与算法,建模与提交结果。
评审规则:每天提供1次算法提交机会,每天更新排行榜,按照F1分从高到低排序。(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,选手每日的成绩请至个人中心查询)
7.24将重新抽样一批相同量级的数据(保证抽样方式一致),7.30零点截止算法的提交,并取7.24-7.30最优成绩前Top10的参赛队进入最终评审。
Top10的参赛队,需要准备评审材料,在8月20日来杭州参加答辩,根据参赛队的算法原理、season2的成绩,决出最终的冠亚季军。
Season 3 10-11月 (线上赛)
邀请决赛成绩TOP3的参赛队参与天猫线上算法的设计,并在双11当天检验效果,根据线上AB Test 结果,决定最终成绩,赢取100w大奖。整个过程将由媒体全程跟踪和监督。
奖项设置:
Season 1 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛
Season 2 阶段奖项:
一等奖:1支队伍,奖金贰拾万
二等奖:1支队伍,奖金伍万
三等奖:1支队伍,奖金贰万
(上述奖项以决赛答辩成绩的最终名次决定)
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布)
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年
Season 3 线上阶段奖项:
Season 2 阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season 2结束后公布细则)
主办方
阿里巴巴集团
合作方
中国中文信息学会、InfoQ技术媒体、SF社区
http://102.alibaba.com/competition/addDiscovery/gameIntroduce.htm