Tools for Data Science(数据科学工具)

上课时间与地点

2023年春季学期:星期三晚上(12-13节)19:20-21:00,沙河学院第二教学楼203

教学大纲 (PDF)

课程简介

数据科学工具课程是中央财经大学核心通识课程,计划为面向我校二年级及以上对数据科学感兴趣的本科生开设的一门现代数据科学相关工具的通识核心课程,所属通识课模块为“科学、技术与环境”。本课程设计模块较为独立,要求学生有基本的Python编程基础,有一定的前期计算机课程如《程序设计》的学习能够帮助学生较为快速的熟悉和掌握课程内容。

该课程的主要内容涵盖数据科学分析的基本工具并体现现代数据分析的基本思路。本课程首先从企业大数据实例出发,使学生更好的理解大数据环境下数据处理的特点以及学习大数据技术的必要性。然后该课程介绍实际应用中的大数据平台基础,授课内容主要包括:Linux系统中的命令行、Python基础、基于Python的网络数据抓取、基于Python的自然语言处理、非结构化数据分析、海量数据并行计算、Hadoop分布式存储与计算。课程最后以案例分析的形式总结数据科学工具平台在实际问题中的应用。

数据科学工具课程是一门基于计算机编程处理复杂数据的工具性课程,其教学内容按照性质包括程序设计、数据科学案例、和应用三个方面,我们采取课堂教学、案例教学、和互动编程三个教学方式相互结合的方式开展。

本课程是一门以应用和实践为主的课程,其考核方式将主要结合平时上机作业加期末考核为主。平时上机实践是学生顺利完成学习目标的必要手段,平时作业占50%。期末考核点为学生是否能够利用已学数据科学工具独立完成数据分析案例分析报告(自由选题)。合格的期末报告应体现学生对一手数据的独立获取能力和探索复杂数据价值的能力。期末报告占40%,平时出勤及课堂表现占10%。

课程讲义

第一部分:数据科学平台与协作