北大光華涂云東:大數據時代,如何應對經濟和金融數據的不穩(wěn)定性?|學術光華

?智能總結北大光華涂云東:大數據時代,如何應對經濟和金融數據的不穩(wěn)定性?|學術光華
數據采集和存貯技術的飛躍發(fā)展,孕育了眾多領域的大數據。大數據出現在包括金融、經濟、管理等各種領域,為計量經濟學的發(fā)展帶來了前所未有的機遇和挑戰(zhàn)。在過去的二十年間,大型因子模型被廣泛地用來分析高維數據。經濟學和金融學中的高維數據集通常以較大的橫截面維度N和較長的時間維度T為特征。而高維因子模型可以用少數幾個潛在的因子來捕捉到高維變量中的大部分信息,因此得到了經管學科的廣泛關注。
關于高維因子模型的理論研究和數據分析經常是基于線性的假設。然而實際的宏觀經濟運作、企業(yè)經營管理經常受到國家政策、新技術革新、全球金融危機等的影響,因此其數據結構經常發(fā)生變化。另外,考慮到大數據觀測時間長,樣本容量大的特點,經濟學模型很容易具有結構不穩(wěn)定性和非線性的特征。因此,結構不穩(wěn)定性的分析在經濟數據,特別是高維時間序列數據上起到至關重要的作用。忽略高維因子模型中出現的結構不穩(wěn)定性,將會導致錯誤的推斷和預測。
北京大學光華管理學院商務統(tǒng)計與經濟計量系涂云東教授在因子模型及其結構不穩(wěn)定性領域進行了深入研究。由涂云東教授與其指導的博士生馬辰辰共同撰寫的兩篇論文“Group Fused Lasso for large factor model with structural breaks”和“Shrinkage Estimation of Multiple Threshold Factor Models”先后發(fā)表在計量經濟學國際頂級期刊Journal of Econometrics(《計量經濟學雜志》)上。兩篇論文針對經濟和金融數據的結構不穩(wěn)定性,在高維因子模型的框架下,提出了關于結構變點和門限效應參數的全新估計方法,力求提升參數估計的準確性和計算效率,進而展現計量經濟學和統(tǒng)計學的方法在分析經濟問題中的廣泛應用。

Part.1高維因子模型及其結構不穩(wěn)定性
因子模型采用少數因子即可捕捉到高維觀測變量中的大部分信息,因此成為分析高維時間序列數據的一個重要的工具。尤其是在目前的大數據時代,因子模型受到了越來越多的關注,其模型表達如下:

其中xit是我們觀測到的高維時間序列數據,ft是潛在的因子,λi是相應的因子載荷,eit是殘差項。自從Stock和Watson(2002)以及Bai和Ng(2002)的有影響力的研究以來,計量經濟學領域和統(tǒng)計學界對高維因子模型中推斷的研究興趣激增,最新發(fā)展包括Bai和Li(2016)、Chen等人(2021)等。
在現有的文獻里,對因子模型理論研究和數據分析大多都是基于線性模型假設(Bai 和 Ng,2002;Bai 和 Li,2012;Bai 和 Liao,2016),也就是說這里的因子載荷λi是一個不隨時間變化的常數。然而,實際的經濟環(huán)境經常會受到科技突破、政策發(fā)布、金融危機等的影響,因此其數據結構經常發(fā)生變化,這使得上述的線性因子模型的假設在實際的數據分析中變得十分脆弱。考慮到大數據觀測時間長,樣本容量大,因子模型可能具有結構不穩(wěn)定性和非線性特征。因此,為了解決真實復雜大數據中的因子降維,帶有結構性變化的大型因子模型和非線性因子模型成為近年來研究的熱點。
Part.2高維因子模型中的結構變點估計
Stock 和 Watson(2002, 2009)研究得出結論,當因子載荷出現小的(局部收斂到0)突變時,通過主成分分析估計的因子同樣具有一致性。但是Breitung 和 Eickmeier(2011)發(fā)現如果忽視因子載荷中的突變,將可能會導致識別出更多因子的錯誤結果。于是學者針對因子模型中的結構變點陸續(xù)提出了不同的檢驗和估計的方法(Chen et al.,2014;Han 和 Inoue,2015;Su 和 Wang,2017;Ma 和 Su,2018;Baltagi et al.,2017,2020)。大部分的研究僅僅關注于因子載荷中只存在一個變點的情況。但是在大數據時代,研究者越來越致力于研究更高維的數據集,這些數據會包含數百個變量,并包含極大的時間跨度,部分甚至所有的變量都可能在采樣周期發(fā)生超過一個突變。但是目前關于多個變點的研究中,通常會存在調節(jié)參數或待估參數過多的問題,從而使得方法過于復雜,理論研究難度較大。所以當因子模型中存在多個結構性變點時,簡單易行的估計和檢驗方法亟待提出。
涂云東教授等2023年發(fā)表的論文很好地解決了這一問題 (Ma 和 Tu,2023a)。他們考慮在大型因子模型中,因子載荷中存在的多個變點的估計問題。也就是說因子載荷λi在時間維度上被劃分成多個時段:

這里結構變點為t1, ... ,tm,αi1, ... ,αim+1,為因子載荷λi在不同時段上的取值,相鄰兩段上的因子載荷互不相同。
該論文拓展了Chen等人(2014)關于單一變點的結果,將因子載荷中結構變點的識別問題轉化為因子回歸方程中系數的結構變點估計,然后提出了一種基于group Lasso 的估計方法來識別變點日期。這里考慮的因子模型允許變點的數量和日期都未知。此外,這篇論文允許因子個數隨著時間的變化而變化,也就是說變點前后可能有新的因子出現,也可能有舊的因子消失。估計方法可以通過簡單的兩個步驟實現:首先,忽略變點,用主成分方法估計因子,并用Bai 和 Ng(2002)提出的信息準則估計因子的數量。其次,用其中的一個估計的因子(例如,擁有最大特征值的因子)作為因變量,其余的因子作為自變量進行線性回歸。將因子載荷中突變點的估計轉換為線性回歸方程的突變點的估計問題。因此可以用Group Fused Lasso的方法(Qian 和 Su, 2016)將回歸方程中所有突變點同時估計出來。
該論文在理論上建立了變點估計量的一致性并推導了其漸進分布。同時,數值模擬表明,與現有方法的結果進行比較,該方法在大幅度提升估計效率的同時得到相對較小的估計誤差。最后,論文將該方法運用到美國宏觀經濟的數據進行實證研究。這個數據集包含108個美國月度的宏觀經濟數據集,包括實際經濟活動指標、價格、利率、貨幣和信貸總量、股票價格和匯率等變量。其時間跨度從1959年1月份到2006年12月份。通過建模和分析,該研究識別出5個變點,分別是1979年9月、1983年9月、1990年11月、1995年7月和2000年5月。這些變點對應于伊朗革命、大緩和時期、勞動生產率的提升和經濟衰退等。
Part.3高維因子模型的多門限估計
考慮高維因子模型結構不穩(wěn)定性的另外一種模型是最近被頻繁研究的門限因子模型。門限因子模型和帶有多變點的因子模型相似卻又不同。一個主要的區(qū)別在于,變點模型的變化是發(fā)生在時間維度上的,而門限模型則是允許因子載荷根據門限變量的大小發(fā)生變化。所以,門限因子模型更適合于描述一些歷史重復的現象。在文獻中,Ng和Wright(2013)模擬了一個符合高維門限因子模型的數據,以研究非線性對商業(yè)周期動態(tài)的影響。Massacci(2017)和Liu和Chen(2020)考慮了高維時間序列的門限因子模型,其中假設時間序列在兩種狀態(tài)之間切換。Wu(2021)進一步將Massacci(2017)的分析拓展到一個帶有多個門限的因子模型中。門限因子模型不僅為降維提供了一個強大的工具,還增強了建模的靈活性,提供了一個更易于解釋和預測的框架,可以輕松捕捉潛在的非線性。
高維多門限因子模型中載荷的建模具體為:

這里的zt是可觀測的門限變量,根據其取值大小因子模型被分成不同的區(qū)制。γ1, ... ,γm是待估的門限值。αi1, ... ,αim+1為因子載荷λi在不同區(qū)制上的取值,且相鄰區(qū)制上的取值不同。
涂云東教授及其合作者2023年的另一篇文章對這種門限驅動的結構不穩(wěn)定性進行了詳細地闡述,并提供了一種創(chuàng)新的估計方法(Ma和Tu, 2023b)。僅僅借助于重排、主成分分析和壓縮估計,該方法能夠將門限的個數和參數值一致地估計出來,并且在操作上簡單易實施,計算上也能大大提高效率。估計方法包含兩個主要的步驟。第一,文章通過將可觀測的時間序列xt按照門限變量zt的大小進行重排,將多門限因子模型轉化為多變點因子模型;第二步運用涂云東教授提出的因子模型變點估計方法 (Ma and Tu,2023a)識別變點,繼而根據變點的位置找到相應門限變量的值來對門限值進行估計。具體的方法介紹參見Ma和Tu(2023b)。
理論方面,他們證明了門限數量和估計值的一致性。蒙特卡洛模擬表明該方法在有限樣本中估計得很好。進而,文章將提出的方法運用到分析美國金融市場數據的分析中。數據跨度為1985年1月到2011年12月,共有324個月度觀測值。這里使用的門限變量zt是Baker等人在2016年提出的關于經濟政策不確定性的衡量指標。正如Baker等人所說,經濟政策不確定性指數與國防、醫(yī)療保健、金融和基礎設施建設等政策敏感部門的股價波動和就業(yè)有關。當政策不確定性不同時,金融市場的行為也相應有所不同,因此文章中通過提出的多門限因子模型來研究經濟政策不確定性是如何影響金融市場,計算了多元非線性動態(tài)系統(tǒng)中的連通性(connectedness) (Massacci, 2017),評估了每個區(qū)制中因子的重要性,最后也對比了門限因子模型和結構變點因子模型的有效性。

該表格截取自涂云東教授文章中(Table 5, Ma 和 Tu, 2023b)。從該表可以看出,隨著經濟政策不確定性的增加,連通性逐漸增加,這說明經濟變量之間的相關性變強,可能會增加系統(tǒng)風險水平。這一發(fā)現有利于風險的衡量和管理。因子的個數在不同區(qū)制中也有所不同。涂云東教授在文章中也分析了每段中因子所代表的具體含義,發(fā)現與市場風險相關的變量在金融市場中發(fā)揮著關鍵作用。尤其是在第二個區(qū)制中,7個因子中有5個與風險有關。此外,隨著經濟政策不確定性的增加,一些行業(yè)投資組合,如食品和煤炭行業(yè),在金融市場中占據著越來越重要的地位。

涂云東,北京大學光華管理學院商務統(tǒng)計與經濟計量系和北京大學統(tǒng)計科學中心聯席教授,研究員。入選首批“日出東方”北大光華青年人才,教育部“長江學者獎勵計劃”青年長江學者,兩次獲評北京大學優(yōu)秀博士學位論文指導教師。2012年獲美國加州大學河濱分校經濟學博士學位,同年6月加入北大光華。三十余篇學術論文發(fā)表在Journal of Econometrics, Econometric Reviews , Journal of Business and Economic Statistics,Oxford Bulletin of Economics and Statistics ,Statistica Sinica ,Journal of Empirical Finance,Computational Statistics and Data Analysis等國際一流專業(yè)雜志。理論研究領域涵蓋非參數/半參數計量經濟模型,模型選擇和模型平均,網絡數據建模,金融計量,信息計量經濟學,模型設定檢驗等;應用研究包含宏觀經濟預測,價格指數建模,網絡數據分析,股票市場預測,新冠肺炎預測等。
(本文轉載自北京大學光華管理學院 ,如有侵權請電話聯系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯考備考 · 復試調劑 · 博士申請 · 中外合辦學 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯考備考群
- ??2026 管理類聯考復試調劑群
- ??博士項目交流群
- ??中外合作辦學項目群
- ?? 添加微信:MBAChina001
- 備注【報考項目】,邀請您加入專屬交流群
最新動態(tài)
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預告:香港理工大學SPEED學院_全新碩士課程專場!26fall入學!
- 06/03 6月3日活動報名 | 北大光華-凱洛格國際EMBA項目Coffee Chat@上海
- 06/03 【活動報名】中國科學技術大學科技商學院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(深圳)MBM2027級招生說明會
- 06/06 長春理工大學2027級工商管理碩士(MBA)考生見面會
- 06/06 重磅!上財滴水湖高金2027級全日制金融碩士“新興金融探索日”活動通知
- 06/06 深圳場 | 清華-康奈爾雙學位金融MBA公開課暨2027級招生說明會報名中!
- 06/06 上海 | 紫荊課堂暨2027級清華MBA招生咨詢會報名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級招生啟動大會來了
- 06/06 活動報名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會
熱門資訊
掃碼關注 MBAChina
掃碼關注
EMBA








