Causal inference vía artificial neural networks

时间:2021-10-12         阅读:

光华讲坛——社会名流与企业家论坛第5857期

Causal inference vía artificial neural networks

主讲人美国加州大学河滨分校 马舒洁教授

主持人统计学院 林华珍教授

时间2021年10月13日(周三)上午10:30-11:30

直播平台及会议ID腾讯会议,ID: 561 165 357

主办单位:统计研究中心 统计学院 科研处

主讲人简介:

马舒洁,现为加州大学河滨分校统计系正教授。于密歇根州立大学统计与概率系获得博士学位。现担任 Journal of the American Statistical Association, Journal of Business & Economic Statistics等多个统计类学术期刊副主编。她目前研究兴趣包括大规模数据分析,精准医疗,机器学习,网络数据分析以及非参数和半参数推断。先后在统计学和经济学国际学术期刊上发表四十余篇学术论文。

详情请见其个人主页: https://profiles.ucr.edu/app/home/profile/shujiema

内容提要:

Recent technological advances have created numerous large-scale datasets in observational studies, which provide unprecedented opportunities for evaluating the effectiveness of various treatments. Meanwhile, the complex nature of large-scale observational data post great challenges to the existing conventional methods for causality analysis. In this talk, I will introduce a new unified approach that we have proposed for efficiently estimating and inferring causal effects using artificial neural networks. We develop a generalized optimization estimation through moment constraints with the nuisance functions approximated by artificial neural networks. This general optimization framework includes the average, quantile and asymmetric least squares treatment effects as special cases. The proposed methods take full advantage of the large sample size of large-scale data and provide effective protection against mis-specification bias while achieving dimensionality reduction. We also show that the resulting treatment effect estimators are supported by reliable statistical properties that are important for conducting causal inference.

最近的技术进步在观察性研究中创造了大量大规模的数据集,为评估各种治疗的有效性提供了前所未有的机会。同时,大尺度观测数据的复杂性对现有的传统因果关系分析方法提出了巨大的挑战。本次报告我将介绍我们提出的一种新的统一方法,用于使用人工神经网络来有效地估计和推断因果效应。我们开发了一种基于矩约束的广义优化估计,该方法采用人工神经网络逼近干扰函数。平均、分位数和非对称最小二乘治疗效果可以视为这个通用的优化框架的特例。我们提出的方法充分利用了大规模数据的巨大样本量,并在实现降维的同时,有效防止了错误识别的偏差。我们还表明,由此产生的治疗效果估计量具有可靠的统计性质,这对进行因果推断是非常重要的。