EN
李红军做客社科大讲堂 剖析机器学习方法在计量分析中的应用

(学生通讯员 张茜)9月22日下午在六教,清华大学社会科学学院经济学研究所副教授李红军做客社科大讲堂,以“运用机器学习方法进行计量分析”为题,为百余名线下及线上师生阐释何为数据分析、机器学习、计量分析,并讲解机器学习方法在计量分析中的应用。

主讲人李红军

讲座伊始,李红军分析了做数据分析的原因,指出从学术角度来看,数据分析在科学知识发现中起着至关重要的作用,对在科学研究时寻找规律、验证定理等大有裨益;从现实需要角度来看,数据分析在许多领域扮演着重要角色,如它可助力商业经营者进行投资决策,可帮助政府部门进行政务管理。数据分析是指以发现信息、得出结论或支撑决策为目的对数据进行搜集、整理、处理和分析的过程。广义上所有的实验室试验都可以看作是参与数据分析。一定意义上,可以从简单的试验设计思量出发,理解数据分析工作。

李红军援引周志华《机器学习》中的观点来解释何为机器学习,指出“机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。”机器学习可分为无监督学习(Unsupervised Learning)、监督学习(Supervised Learning)、半监督学习(Semi-Supervised Learning)和强化学习(Reinforcement Learning)。目前机器学习方法在自动驾驶、面部识别、金融交易等领域已取得重要突破。

李红军指出,在经济学的三大领域中,如果把微观经济学看作个体经济行为、宏观经济学看作总体经济行为,那么计量经济学可以看作经济数据行为。每个计量分析都对应着一种对现实经济行为的描述。计量分析与机器学习有所区别。我们可以从机器学习中“学习(Lesson)”,机器学习对分类和预测、新估计方法、新数据来源等方面助益颇多。李红军以投资组合、违约风险为例,具体阐释如何运用机器学习方法进行计量分析。

最后,李红军总结“机器计量”的潜在挑战主要体现在以下四个方面:一是优化问题,如非凸性(Non-Convex)、全局解(Global Optimal);二是可解释性,如AI模型的可审计性以及公开透明度;三是可靠性,如不同的应用场景(Self-Driving);四是理论基础,如神经网络的理论性质。

在演讲结束后的互动环节,李红军回答了同学们提出的数据分析在无人驾驶领域的应用、“机器计量”的发展与挑战、机器学习的预测等问题。

本场讲座是清华大学社会科学学院和清华大学国家大学生文化素质教育基地联合主办的2022年“社科大讲堂系列”第五讲,由清华大学社会科学学院孙震副教授主持并点评。

相关链接

李红军,清华大学社会科学学院经济学研究所副教授。现任Journal of Digital Economy副主编,清华大学社会科学学院数字经济专业硕士项目主任。博士就读于德州农工大学(Texas A&M University),主要从事非参数计量、机器学习、实证产业组织等领域的理论与应用研究,主持和参与多个国家级基金项目,已有多篇论文发表于Journal of Econometrics, China Economic Review, Economics Letters, Econometric Reviews和Empirical Economics等经济学期刊。

供稿:清华大学社会科学学院

国家大学生文化素质教育基地