耦合 (概率)

耦合,或稱關聯結構(英語:Copula),為處理統計中隨機變量相關性問題的一種方法,由一組隨機變量的邊際分佈來確定它們的聯合分佈。通過關聯結構來確定一個聯合分佈的方法是基於如下思想,一個簡單轉換可以通過分別將每個邊緣分佈都轉換為平均分佈的轉換組成。這樣,一個關聯結構(dependence structure)就可以表達為一個基於上述所得平均分佈之上的聯合分佈,而關聯結構(copula)即是邊緣均勻隨機變量之上的一個聯合分佈。在實際應用中,上述的轉換可能被設置為每個邊緣變量的初始化步驟,或者上述轉換的參數可能根據具體關聯結構的對應參數設置。

按照所表達的關聯關係的不同,關聯結構被分為很多不同類別。典型情況下,一個種類的關聯結構有多個參數用來表達不同的關聯強度和關聯類型。下面將大概描述一些有代表性的關聯結構。關聯結構的一個典型應用是,通過選擇某一種類的關聯結構來定義某一適合特定樣本數據分佈的聯合分佈,當然關聯結構也可以來自於任何相應的給定聯合分佈。

基本思想

考察兩個隨機變量 ,  ,分別具有連續累積分佈函數  。通過分別在兩個隨機變量上應用概率積分轉換,得到  。因此  都是具有連續均勻分佈的變量,相關性通常取決於  是否是相關(自然,如果  是不相關的,那麼  也是不相關的)。因為這個轉換是可逆的,可以定義  之間的相關性等於  之間的相關性。因為  是均勻分佈的隨機變量,所以問題被簡化為定義一個在兩個均勻分佈之上的二項分佈,這就是關聯結構。所以,這一基本思想就是,通過把邊緣變量轉化為均勻分佈變量而不再需要考察很多不同的邊緣分佈以簡化問題,然後再把相關性定義為一個在均勻分佈之上的聯合分佈。

定義

一個 關聯結構是一個定義在 單位立方體 上的多元聯合分佈,其每個邊緣分佈都是在 區間上的均勻分佈

特別的, 是一個n維關聯結構,有

  有至少一個分量為 
  所有分量為 除了第i個分量等於 
 n維遞增的,也即,有每個hyperrectangle  
 

其中  所謂的 C-體積(volume)。

Sklar定理

由Sklar提出的這條定理[1]是大多數關聯結構的應用的基礎。Sklar定理指出,一個給定的 個變量的聯合分佈函數  為其邊緣分佈函數,必存在這樣一個關聯結構 使 

二項分佈為例,Sklar定理應用如下。對任一二項分佈函數 ,令  為其單變量邊緣概率分佈函數。那麼存在關聯結構 以使

 

(此處已知分佈 和它的累積分佈函數)。此外,如果邊緣分佈  連續,那麼關聯結構函數 是唯一的。否則,關聯結構 在邊緣分佈的值域上是唯一確定的。

弗雷歇–霍夫丁(Fréchet–Hoeffding)關聯結構邊界

 
Graphs of the Fréchet–Hoeffding copula limits and of the independence copula (in the middle).

最小(反單調)關聯結構:是所有關聯結構的下邊界。僅在二項分佈中,變量間表現為完全負相關。

 

n-元關聯結構,下邊界為

 

最大 (共單調 ) 關聯結構:是所有關聯結構的上邊界。其在二項分佈中,變量間表現為完全正相關:

 

n-元關聯結構,上邊界為

 

結論:對所有關聯結構Cuv),

 

對於多元關聯的情況為

 

關聯結構種類

正態關聯結構

 
Cumulative distribution and probability density functions of Gaussian copula with  

在金融建模中常用到的一個關聯結構是正態關聯結構,正態關聯結構是根據Sklar定理由二元正態分佈構成。設 是標準二元正態累積分佈函數,相關係數ρ,則正態關聯結構函數為

 

其中,  表示標準正態累積分佈函數

C微分得出關聯結構的密度函數:

 

其中

 

皮爾森矩相關係數 標準二元正態分佈的概率密度函數,其標準正態密度為 

參考資料

  1. ^ Sklar, A. Fonctions de répartition à n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris. 1959, 8: 229–231.