卡爾曼平滑,卡爾曼平滑算法
當前的經濟周期狀態表明,增長周期已開始回升,貨幣財政周期向上擴張,主要可見經濟指標的回穩態勢預計會在3月份顯現,指標數值的公布和交易反應的融入預計在4月中上旬,經濟企穩的時間點也預計將出現在一季度末和二季度初之間。
經濟周期是自上而下分析大類資產的重要起點。以美林時鐘為代表,雖然有效性近年來在國內外都打了折扣,但其所構建的分析范式已經成為市場宏觀研究的“套路”。理論上,它是根據教科書中總需求-總供給模型的交叉,以產出缺口和通脹兩個指標為代表,將宏觀經濟運行分為四個象限(階段):復蘇、過熱、滯脹和衰退,然后再探究不同象限內大類資產所表現出來的規律性特征及其背后的理論解釋。例如復蘇早期是配置股票的最佳時點,而衰退早期是配置利率債的好時機,過熱階段最好買商品,滯脹時期最好持有現金(短久期資產)。基于此分析范式,周期視角的風格輪動、行業輪動等配置策略也已經很成熟。另外兩種拓展路徑是增加金融周期,或將周期階段劃分得更細,如馬丁?普林格的“雙周期-六階段”資產配置模型(圖1)。
卡爾曼濾波不同于傳統濾波(高通,帶通之類的)。卡爾曼濾波實際上是對目標狀態的一種估計,是一種目標狀態估計方法。以運動目標為例,目標是有自己的運動方程的,如X=AX+Bu,但在實際中,目標的運動并不完全遵循他的運動。
圖1:企業、經濟、金融周期與大類資產配置(以美國為例)
其實卡爾曼、粒子是叫估計器estimator。估計estimate當前值叫濾波filtering,估計過去叫平滑smoothing,估計未來叫預測prediction。不過為了方便,往往就叫濾波器了。至于高通,低通,則是濾波幾個相互正交的分類:低通,高通 開環,。
那么,關鍵之關鍵就是確定經濟周期,如果第一步就錯了,那資產配置建議很可能就謬以千里了。GDP無疑是經濟周期最好用的指標,但實踐中,GDP指標存在滯后和低頻兩個缺點,所以往往只能做事后驗證。兩個常用的思路是:一,尋找領先指標,典型如信貸、工作小時數、PMI(新訂單等),以及對特定群體的信心調查數據等;二,使用更高頻的數據,如日度、周度等。這兩種方法并非互斥關系,實踐中可進行交叉驗證,相得益彰。但是,兩種方法都存在一個共同的問題,就是同一方法內部的不同指標可能給出相反的信號。所以,有一種方法就是構建一個“擴散指數”,來表示主要方向。就像投票,一個指標一個投票權,少數服從多數。這種方法不免主觀了,常犯錯誤,畢竟指標對經濟周期而言并非等權重。
①卡爾曼濾波是一個算法,它適用于線性、離散和有限維系統。每一個有外部變量的自回歸移動平均系統(ARMAX)或可用有理傳遞函數表示的系統都可以轉換成用狀態空間表示的系統,從而能用卡爾曼濾波進行計算。②任何一組觀測數據都。
MF-DFM方法:服務宏觀大類資產配置
經濟周期是眾多不同領域的經濟活動在差不多接近的時期中所產生的擴張、衰退、復蘇的反復過程。長久以來,經濟周期的運動呈現出了兩個基本特性:一是可觀測的經濟指標協同變化;二是擴張階段與收縮階段的非對稱性。由史觀之,擴張是經濟的正常狀態,衰退往往是短暫卻又痛苦的。
在顯性層面,經濟周期的波動是經由一系列可觀測的經濟變量表達的;而在隱性層面,則是由少量共同的、隱藏的宏觀因子驅動的,卡爾曼平滑算法,這些因子反映了經濟復雜系統的真實狀態。基于這種動態因子模型的思想,我們構建了混頻動態因子宏觀即時預測模型。
在顯性層面,經濟周期的波動是經由一系列可觀測的經濟變量表達的;而在隱性層面,則是由少量共同的、隱藏的宏觀因子驅動的,這些因子反映了經濟復雜系統的真實狀態。基于這種動態因子模型的思想,我們構建了混頻動態因子宏觀即時預測模型。
1)卡爾曼濾波實際上是一個低通濾波器,通過增益系統調節濾波的帶寬。你多次濾波就相當于級聯了濾波器 2)能否多次濾波,要考慮你兩次濾波的條件,兩次同樣的系數和輸入的話 ,相當于再次平滑,只有第二次有額外的信息輸入或。
圖2:經濟數據的協同波動(紅色粗線為GDP,黑色粗線為PPI)
方法服務于研究目的,應用預測模型主要是為了服務宏觀大類資產配置研究中的幾項突出需求,該模型的優勢對應的也恰恰是傳統方法的不足。
首先,該模型允許數據的混頻。混頻數據普遍存在于經濟、資產運行中,季度的如GDP、人均收入數據等,月度的如消費、投資、通脹數據等。盡管經濟狀態每天都在產生新的演變,但不是每天都能得到新的觀測值。GDP是整個經濟系統中最重要的指標,中國季度GDP及其增長率數據通常是在季度結束后20日公布,這與日度更新的資產價格高頻數據之間存在著極大的落差。傳統方法為將數據頻率統一,需要進行重采樣或降采樣。如果采用加總法將高頻數據降低頻率改為季度數據,這往往會導致人為的數據信息減少;或者將低頻數據通過插值法改為高頻數據,這又會導致信息的虛增。若放棄季度公布的GDP等數據的采樣,則會導致經濟系統中最重要的數據缺失。借助MF-DFM的卡爾曼平滑估計特征,則能夠解決這個問題,通過狀態空間模型的形式納入高頻數據和低頻數據,這個過程中的副產品是預測月度的GDP數據。
卡爾曼濾波器是一種由卡爾曼(Kalman)提出的用于時變線性系統的遞歸濾波器。這個系統可用包含正交狀態變量的微分方程模型來描述,這種濾波器是將過去的測量估計誤差合并到新的測量誤差中來估計將來的誤差這種濾波方法以它的發明。
第三,這一模型能吸納高維度的經濟數據。MF-DFM模型使用了狀態空間模型的稀疏矩陣特征,避免估計難度隨著模型中包含的變量數量的增加而增加,從而避免維度詛咒的問題。納入較多的變量,很多經濟數據中可能含有預測的目標變量(如GDP)信息,因此能提升預測中的有效信息。
第四,這一模型能避免傳統指數構建方法的不足。模型從高維數據中提取少量共同因子,構建經濟周期因子或指數,從眾多經濟時間序列數據中估計和解釋驅動各變量波動的共同動態因子,是判別和分析經濟周期波動的有效工具之一。傳統經濟指數構建方法的不足,如PCA(主成分分析技術,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標)造成信息或變量丟失,并且假定異質性誤差項服從同方差分布,本質是靜態轉移方程特例下的動態因子模型;合成指數法難以解決權重問題,并且合成指數本身不具有經濟含義,底層指標的差異導致構建的合成指數振幅不同,獲得的經濟周期波動的指示度也存在差異;而擴散指數則難以明確地表示經濟波動的強弱。

第五,該模型應對鋸齒狀數據問題,允許缺失值存在。經濟數據的特點是發布時間不一致,頻率不統一,在某一時點獲得的數據指標參差不齊,呈現鋸齒狀,部分數據更新但部分數據尚未更新,而以尾部齊整的數據集構建模型又會導致時間的滯后。大部分情況下,經濟數據是非平衡數據集,不可避免地存在數據缺失問題。借助卡爾曼濾波與EM估計對缺失值的填補特征,可以解決數據鋸齒狀和缺失值的問題。
最后,該模型準確性相對提高。一些學術研究已證明,充分利用信息的混頻動態因子模型在預測和經濟周期表現上要優于MIDAS、VAR等其他模型。學術上,有研究對比了包括DFM在內的46種預測模型,發現DFM優于其他大部分模型。
混頻動態因子:從升維到降維

MF-DFM模型包括觀測方程和轉移方程兩部分。觀測方程描述的是可見經濟變量與潛在共同宏觀因子之間的關系,即可觀測的經濟變量是由不可觀測的低維度經濟因子主導決定的。轉移方程描述的是潛在因子的系統動態過程,不可觀測的經濟周期因子自身也具有動態演化過程,一般假定服從一階自相關過程。
在混頻數據的處理上,假定低頻數據是由潛在的高頻數據構成的,因此可以將季度序列轉化為潛在的月度變量。對于流量型數據,季度變量等于潛在月度數據的加總。存量數據季度變量等于對應月度的數據。

EM估計的中心思想是,通過實際出現的結果反推未知參數,使得出現結果的可能性達到最大,這比PCA+OLS兩階段估計的限制更少,也能夠應對數據缺失、修正和變化,并對缺失數據進行填補;在因子上,可分為不同的子集合,不需要全部暴露為全局因子。具體執行上又可以分為期望步(E-step)和極大步(M-step)兩個步驟。
在期望步驟,構造不存在缺失值的初始集合,采用初始參數或上一次迭代得到的模型參數,估計給定數據下的極大似然估計的期望值。在極大步驟,基于給定的期望步驟得到的參數結果,重新使用卡爾曼濾波對潛在因子的估計進行更新,得到新的參數。期望步和極大步交替進行迭代,在每一步都考慮到與估計因子相關的不確定性,當前后兩次迭代的殘差平方和之差小于某一很小的絕對收斂閾值時(例如0.0001),終止迭代。因EM方法未涉及非線性優化算法,使得迭代收斂迅速,一般在100次以內的迭代即可收斂。
在底層經濟指標的選取上,綜合指標的底層選擇有幾方面要求,首先,經濟指標是宏觀相關領域的重要指標;其次,指標沒有重要的計量方法修改;最后,指標邏輯清晰,沒有中斷。
模型顯示,2021年增長周期有兩個底部,一是8月份,增長周期指數分值為-1.03,主因可能是限產限電引起的供給沖擊;第二個底部是12月份,增長周期指數分值為-1.06,主因可能是內需的弱化。當前模型顯示2022年1月增長周期已開始回升,1月為-0.95。預計2022全年增長周期指數平均為-0.58,增長周期指數比2021年的-0.14要差,也弱于疫情前的2019年(-0.23),但主要改觀是,方向轉為向上增長。
圖3:增長周期指數
通脹周期指數的預測期同樣至2022年11月,通脹周期指數主要反映綜合通脹的方向及強度。模型顯示,2022年通脹周期將整體下行,豬價、大宗商品不構成通脹的上行力量。但通脹周期全年都可能處于較高的歷史分位水平,年均分值2.38,高于歷史上91.63%的時間(2000年至今),這意味著通脹問題今年都可能將無法徹底緩解(圖4)。
圖4:通脹周期指數
貨幣財政周期指數預測期至2022年11月,反映了包括貨幣、財政在內的綜合金融條件的寬松程度及方向,指數分值越高說明寬松程度越大。模型預測顯示,2022年貨幣財政周期將上行,金融條件更加寬松。根據疫情以來的貨幣財政周期分值移動軌跡,2020年2月達到最高分值0.9,隨后下行,到2021年2月到達最低分值-4.26。預計2022年貨幣財政周期分值為-0.94,寬松程度好于2021年(-2.5)和疫情前的2019年(-1.4),但差于2020年(-0.3)。
在具體經濟指標的預測上,模型以2022年2月7日的數據為訓練集,得到因子載荷和因子估計值,在此基礎上對一季度GDP進行了預測。在2月10日金融數據公布后,模型顯示M2及社融使一季度GDP預測值分別上升0.111%和0.005%,但由于M1同比下降1.9%,對模型影響更大,導致一季度GDP的預測值下降。2022年1月10日,2月7日,2月10日三次對一季度GDP的預測分別為5.05%,4.97%,4.93%。
同樣以2022年2月10日作為更新時點,我們對當時尚未公布的1-3月的CPI、PPI、出口、消費、投資等主要經濟指標進行了預測(表2)。除外貿相關預測偏低外,其他指標預測均處于基本合理范圍。模型預測顯示增長、消費、地產等主要領域預計在3月份企穩向上。因此,總體而言,當前的經濟周期狀態表明,增長周期已開始回升,貨幣財政周期向上擴張,主要可見經濟指標的回穩態勢預計會在3月份顯現,指標數值的公布和交易反應的融入預計在4月中上旬,經濟企穩的時間點也預計將出現在一季度末和二季度初之間。
表2:主要經濟指標的預測
(邵宇為東方證券首席經濟學家、總裁助理,中國首席經濟學家論壇理事)
版權聲明:本站文章均來源于網絡,如有侵權請聯系刪除!
