《AI与数据科学竞赛白皮书 2022 》发布!七大看点全解析发布时间: 2024-04-01 来源:运营管理领域

  原标题:《AI与数据科学竞赛白皮书 2022 》发布!七大看点全解析

  由DataCastle数据城堡联合福建省数据治理与数据流通工程研究院、电子科技大学大数据研究中心、山东省数据要素创新创业共同体、深圳国家基因库、亚马逊云科技、移动云编写的《AI与数据科学竞赛白皮书2022》(以下简称“白皮书”)已正式发布。

  人工智能与数据科学竞赛是一种以竞赛为形式的数据应用模式,在短时间内聚集大量数字人才,通过合理的赛事设计促进AI应用开发和数据要素的价值挖掘。

  人工智能与数据科学均以数据为基础,数据科学侧重依靠数据获得见解与理解力,人工智能侧重依靠数据产生应用,二者相互依赖、一同推动科技发展。

  AI与数据科学竞赛作为一种创新业态,对内汇聚产学研用多方资源,对外影响、助力整个产业生态。

  随着政府数字化建设,政府负担着创新公共数据要素流通方式,激活数据要素潜能,探索公共数据要素应用方式等重要工作,人工智能与数据科学竞赛慢慢的变成为政府数字化建设发展的重要途经。

  人工智能与数据科学竞赛可以帮助企业实现大量算法人才快速汇聚,并通过竞赛结果进行人才甄别筛选,进而挖掘优秀人才,优化企业技术人才梯队,完善企业数据人才储备;同时,人工智能与数据科学竞赛能够助力企业完善云生态建设,提升市场竞争力。助力企业云生态建设,包括计算基础、产品功能完善,企业品牌建设、云产品营销、社区建设、用户沉淀等。

  数据科学成为高校未来的主流研究领域是大势所趋,人工智能与数据科学竞赛为高校提供了一个良好的实训机会,让高校数据科学学科建设更加系统化,更加完整,同时可以提升学生数据科学应用能力,促进高校人才培养。

  近年来数据科学赛事市场中专项赛事比例逐渐增加,但在政府办赛中,综合赛事仍是主流。同时,数字经济发展和智慧城市建设成为多地政府部门的重点工作,以数字孪生为代表的人工智能技术在智慧城市建设中发挥着积极作用。

  人工智能与数据科学竞赛作为技术社区的重要组成部分,被大型技术企业作为社区引流、用户留存的重要手段,同时通过竞赛提升社区用户参与度,提高用户粘性和社区技术浓度。

  人工智能与数据科学竞赛诞生于学术会议,在出现之初长期作为学术研究活动存在,但近年来学术机构独立办赛比例持续下降,与政府、企业合作办赛逐渐成为科研学术机构办赛的主要选择。

  在2022年统计到的635道赛题中,计算机视觉(以下统称CV)相关赛题占比36.5%,达232道,是占比最大的技术方向。

  自2021年起,工业类人工智能与数据科学竞赛逐年增多。在2022年的12场工业类赛事中,全部算法赛赛题均围绕工业生产中的实际问题进行设计,赛题难度适中,赛题方案易落地。伴随工业互联网的普及应用以及传统工业制造业数字化转型的趋势,工业制造企业开始重视对工业数据的全面深度感知、实时传输交换、快速计算处理和高级建模分析,实现智能控制、运营优化和生产组织方式变革。

  政府办赛虽然只占据2022年人工智能与数据科学竞赛总场次的37%,但在整体竞赛生态中具有较大影响力。

  数据驱动是公司实现数字化转型的核心方式,AI与数据科学竞赛可以弥补企业在数字化转型过程中数据应用环节人力、时间、成本等方面的不足,部分竞赛赛题深入到数据处理环节,探索复杂数据处理的新方法。

  科研机构以科研成果产出与科研人才培养为发展重心。其办赛以精准为重点,吸引领域内顶尖人才参赛是其办赛的侧重点。

  AI与数据科学竞赛需要的赛事设计能力、技术支持能力、赛事运营宣传能力可能超出部分主办机构的能力或职责之外。因此赛事平台成为将数据资源转化为完整竞赛的重要第三方。

  DC竞赛(DataCastle 数据城堡)平台于2016年正式上线,由电子科技大学大数据研究中心主任周涛教授发起成立,平台基于公司多年竞赛业务体系的技术沉淀,为用户提供竞赛、实训、人工智能实验室、算力资源等服务。

  DC竞赛以Kaggle竞赛模式为蓝本,采用平台化、模块化、自动化的办赛方式,同时结合国内具体办赛需求,基于自研数据科学实训平台DCLab与相关专利,为主办方提供定制化办赛服务。经过多年办赛实践,DC竞赛平台发展成为国内领先的第三方办赛服务供应商,平台注册用户超过32.5万人,上线余万元。

  和鲸社区(原 “科赛网”)成立于2015年,是中国知名的第三方数据科学社区之一,较早一批专注于大数据算法比赛的平台,拥有近20万注册数据科学家用户, 辐射超过30万数据人才群体。

  DF竞赛(DataFountain)是北京数联众创科技有限公司旗下品牌, 是国内领先的数据竞赛服务平台和数据智能协同创新平台,旨在围绕协作、数据、知识、技能形成大数据爱好者的专业成长链路,为数据科学家及产业赋能。

  阿里集团于2014年正式推出 “天池” 大数据科研平台, 该平台基于阿里云的开放数据处理服ODPS, 面向学术界开放海量数据(阿里数据及第三方数据)和分布式计算资源,平台业务包括 :天池大数据竞赛、数据实验室、开放式教学、数据人才认证。

  飞桨AI Studio是基于百度深度学习平台飞桨的人工智能学习与实训社区, 提供在线编程环境、免费 GPU 算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。分设飞桨大赛、飞桨常规赛、新人练习赛等赛事分类。

  华为云大赛是华为云开发者平台打造的开发者综合赛事平台, 其竞赛内容涵盖机器学习、软件开发、硬件开发、系统开发、工业互联网等众多方向。华为云赛事平台严格来说并非数据科学竞赛平台, 而是综合性开发者赛事平台, 并且只为华为集团自身业务服务。

  在学历背景方面,参赛者群体中60%左右为硕博人才,本科人才占比37.88%。在人才专业情况方面,其中87%左右的AI与数据科学竞赛人才来自于理工科背景。由于经济管理学科与数据密切相关,诸多赛题来自金融领域,因此还有部分竞赛人才来自经济学、管理学专业。

  学生是竞赛人才的主力,占比约64%,在职人员多数将AI与数据科学竞赛作为技能练兵场和兴趣俱乐部,主要人群为IT及相关行业的工作者,以及从事金融、咨询等与数据相关方面的工作者。

  根据参赛者的典型特征进行归类总结可以帮助我们更好地进行赛事设计,并分析研判未来赛事的发展方向。

  以奖金激励和名誉获取为核心诉求的参赛者以在校学生和职场新人为主,可支配时间充裕,技术实力较高,有冲击奖金和 TOP 排名的精力与实力,这些参赛者也是各大竞赛前排选手的重要组成部分。

  以就业创业为核心诉求的参赛者求有着非常强的针对性,主要参与某类垂直领域的专业赛事,如金融、科技、生物医药等。

  以获取数据和技能实训为核心诉求的参赛者主要由数据科学初学者为主,受限于数据获取困难和实训机会匮乏而选择参赛,是各大赛事中占比最高的参与者。这些参赛者技术实力较弱,但学习意愿强,有机会发展为竞赛核心选手。

  以社交活动为核心诉求的参赛者数量少,影响力大。在竞赛社区加速发展的环境下, 部分竞赛深度选手开始组建交流社区、俱乐部、自媒体平台,成为竞赛领域意见领袖,对竞赛运营招募与舆情风向施加巨大影响力。