和鲸《数据科学教育白皮书》,盘点专业发展势头
浏览:189 时间:2022-12-27

随着科学技术的不断更新,移动互联网的普及改善了人类记录数据的方式,随后数据爆发式地进入大数据时代。今天是国家致力于数据技术发展的时代,越来越重视数据科学新专业的定义。截至目前,全国34个省级行政区中,有29个行政区的481所高校成功增设了数据科学与大数据技术专业,其中部分高校设置了不同程度的数据科学与大数据技术两个专业。

那么,为什么就业市场如此青睐数据科学专业呢?

主要原因是在信息爆炸的时代,数据的高数量、高维度、高更新速度和高商业价值对传统的硬件存储、数据管理和统计分析方法提出了更高的要求。原始统计大多适用于小样本,原始统计分析工具主要是Excel,但面对这样的大数据往往无能为力。

比如一个人看视频网站的娱乐节目,下一次刷新网页,就会看到新的娱乐节目或者上一个视频博主的新视频。视频中插入的广告也与视频内容相关。这是网站重要的广告盈利模式,通过数据分析预测受众的偏好。这是数据科学中的预测分析,预测分析只是其冰山的一角。

因此,数据科学需要包含更全面、更全面的内容,更像是针对实际数据问题的一些基础、专业知识。此外,数据科学涉及如何从数据过渡到模型,再过渡到应用。因此,数据科学学科需要不同的角色和技能,包括统计学家、计算机科学家和软件工程师,其中不同的角色会带来不同的结果。

那么数据科学的教学应该如何实施呢?

国内领先的数据科学协作平台和鲸科技联合腾云大学TalkingData、全球知名云计算服务平台AWS、开源学习社区Datawhale共同发布《数据科学教育白皮书》(以下简称白皮书),旨在聚焦数据科学教育领域,从全球视角研究数据科学教育的发展轨迹和方向。

《白皮书》认为数据科学可以分为三个不同的核心:编程技能、数学和统计能力以及行业知识。这些领域共同构成了定义中的技能和技术,包括数据采集、数据清洗、数据分析、假设创建、算法、机器学习、优化、结果可视化等。数据科学整合了这些领域和技能,并支持和改进了从原始数据中提取见解和知识的过程。

数据科学也与其他学科密切相关。一方面,作为高新技术产业的支柱,数据科学和信息技术对材料和器件的需求带动了物理学和生物学的发展;另一方面,数据处理、存储、检索等技术推动物理学、生物学、地球科学等现代科学进行更复杂、更全面的深入研究。

数据科学是一个系统的、跨学科的研究领域,用于从各种形式的数据中获取知识和洞察力。它就像一个粘合剂,整合不同领域的知识和不同人的想法,解决数据问题,将信息转化为知识和可操作的见解。合作将成为数据科学领域的常态。

想了解更多数据科学教育项目的发展现状和学科建设的路径,关注微信官方账号、和鲸,后台回复《数据科学教育白皮书》,即可获得完整内容。