9月8日,9778818威尼斯第十期午餐研讨会在红楼2号楼226学术报告厅举行。此次研讨会由保险精算系助理教授毕达宁做论文分享,共有二十余名师生参加本次午餐研讨会。
研讨会上,毕达宁老师做了主题为《Sieve Bootstrap for High-dimensional Time Series: A Factor Model Approach》的学术报告。在经济社会与日常生活中,高维时间序列数据是一种十分常见的数据类型,如一段时间内的PM10的排放量、一段时间内的股价收益率,一定时期内不同年龄人口的死亡率数据等。然而在统计学上,随着数据集维数的增加,学者们总是会不可避免的遇到“维数祸根”的困境,即随着维数的增加,很多统计方法的有效性会降低甚至是直接失效;同时,由于时间序列数据大多具有自相关的性质,其有效样本量相对于其余数据量会偏低。如何在诸多问题的困扰下进行有效的统计推断,是一个非常重要的问题。AR sieve bootstrap是统计学中常用的抽样统计方法,能够帮助人们研究总体分布的性质。但对于高维时间序列数据,该方法也面临着前文所述的问题。毕达宁老师在总结前人研究的基础上,提出先用因子模型对模型进行降维,再利用sieve bootstrap方法构建新的样本,从而帮助我们进行高维数据的处理与统计推断。为了加深与会老师及同学们的理解,毕达宁老师以PM10排放数据集为例,向大家展示了通过因子模型处理之后的数据集进行参数与非参数bootstrap抽样的结果以及相关的统计量。
读研在金统
金大团