Python程序设计与财经数据挖掘

课程简介

Python程序设计是面向财经和统计专业学生开设的一门以应用为主的编程课程,该课程最早由李丰老师在中央财经大学以公开讲座的形式开设,后成为中央财经大学金融、会计和MBA项目的核心课程。 本课程分为三部分,第一部分为Python程序设计,第二部分为Python财经应用,第三部分为基于Python的财经数据挖掘。

授课教师

李丰博士(ORCiD: 0000-0002-4248-9778)内蒙古鄂尔多斯人,就职于北京大学光华管理学院,任商务统计与经济计量系副教授、研究员、博士生导师。本科毕业于中国人民大学,博士毕业于瑞典斯德哥尔摩大学,研究领域包括贝叶斯统计学,大规模时间序列预测方法,大数据分布式学习等。曾获瑞典皇家统计学会 Cramér 奖(最佳博士论文),国际贝叶斯学会青年奖励基金, 第二届全国高校经管类实验教学案例大赛二等奖。

李丰博士参与国家自然科学基金重大项目、主持国家社会科学基金一般项目和国家自然科学基金青年项目等国家级课题。他的最新研究成果发表在统计与预测期刊 Journal of Computational and Graphical Statistics, Journal of Business and Economics Statistics (ABS 4), International Journal of Forecasting (ABS 3), 管理运筹期刊 European Journal of Operational Research (ABS 4),金融会计期刊 Contemporary Accounting Research (FT 50), 医学期刊 BMJ Open, Journal of Affective Disorders 等,两篇论文获评 ESI 高被引论文,他同时著有 Bayesian Modeling of Conditional Densities,《大数据分布式计算与案例》和《统计计算》。李丰老师开发适用于大规模时间序预测的开源计算机算法和程序,代码详见 https://github.com/feng-li

李丰博士在世界贝叶斯大会国际预测大会等作过邀请报告。他的报告幻灯片可以从这里下载

📢📢📢 李丰老师招收统计学专业博士生。同时热忱欢迎优秀校内外优秀学生(①有读博意愿的在读研究生 ②本校大四拟录取直博学生③大三以上学有余力同学)加入研究团队。研究团队为优秀本科生提供每周一对一指导、参与核心科研项目、与国际知名大学合作研究的机会。

Let’s fika! 李丰老师在学期中每周一下午 13:00-14:00 在办公室与学生共享美好咖啡时光(瑞典语 fika),欢迎同学们讨论有趣的学术想法,以及分享学业和成长的点滴!

参考书

Python可以被广泛地使用在财经领域,以下列出一些零基础书目。

类别书名中译本
数据分析Python for Data Analysis
(by Wes McKinney)
利用Python进行数据分析(原书第2版)
数据抓取Web Scraping with Python: Collecting More Data from the Modern Web
(by Ryan Mitchell)
Python网络爬虫权威指南 第二2版
金融分析Python for Finance: Mastering Data-Driven Finance
(by Yves Hilpisch)
Python金融大数据分析 第2版
会计分析Python for Accounting: A Modern Guide to Using Python Programming in Accounting
(by Horatio Bota)
暂无

讲课视频

第一部分:Python程序设计

Jupyter Notebook (鼠标右键点击另存为下载)Slides and
Teaching videos (CN)
MBA
program
Statistics, Finance
and accounting programs
L01.1: Introduction to Python for Economists and StatisticiansSlides
L01.2: Python from ScratchSlides
L01.3: Python Functions and ModulesSlides
L02.1: Python Builtin Data StructuresSlides
L02.2: Data Wrangling with PandasSlides Video1 Video2 Video3
L02.3: Manipulating DataFrames with PandasSlides Video
L03.1: Pandas Data VisualizationSlides Video1 Video2
L03.2: Statistical Data VisualizationSlides Video1 Video2
L03.3: Interactive Data VisualizationSlides Video
L04.1: Reading and Cleaning Excel FilesSlides
L04.2: Groups and pivot tables with PandasSlides
L04.3: Strings and Custom Functions in PandasSlides
L05.1: Fundamental Modules for Statistical ModellingSlides Video1 Video2
L05.2: Python for Statistical ModellingSlides Video1 Video2 Video3 Video4

第二部分:Python财经应用

Jupyter Notebook (鼠标右键点击另存为下载)Slides and
Teaching videos (CN)
MBA
program
Statistics, Finance
and accounting
programs
L06.1: Python and TextsSlides Video
L06.2: Natural Language Processing with PythonSlides Video1 Video2
L06.3: Text Feature ExtractionSlides Video
L06.4: Chinese Text ProcessingSlides Video
L07.1: Web Scraping with PythonSlides Video
L07.2: Interactive Scraping with SeleniumSlides Video
L08.1: Probabilistic Topic ModellingSlides Video
L08.2: Automated ARIMA forecasting with PythonSlides Video

第三部分:财经数据挖掘

Jupyter Notebook (鼠标右键点击另存为下载)SlidesTeaching videos (CN)
L01: Time Series Data Mining IntroductionSlides1, 2, 3
L02: Time Series Decomposition MethodsSlides1, 2
L03.1: Time Series Forecasting with ARIMASlides1
L03.2: Model Selection and Seasonal ARIMASlides
L04: Forecasting Combinations and Forecasting UncertaintySlides
L05: Time Series Anomaly DetectionsSlides1
L06: Time Series forecasting at scaleSlides1