关于与“
耦合 (概率)”标题相近或相同的条目,请见“
耦合”。
耦合,或称关联结构(英语:Copula),为处理统计中随机变量相关性问题的一种方法,由一组随机变量的边际分布来确定它们的联合分布。通过关联结构来确定一个联合分布的方法是基于如下思想,一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成。这样,一个关联结构(dependence structure)就可以表达为一个基于上述所得平均分布之上的联合分布,而关联结构(copula)即是边缘均匀随机变量之上的一个联合分布。在实际应用中,上述的转换可能被设置为每个边缘变量的初始化步骤,或者上述转换的参数可能根据具体关联结构的对应参数设置。
按照所表达的关联关系的不同,关联结构被分为很多不同类别。典型情况下,一个种类的关联结构有多个参数用来表达不同的关联强度和关联类型。下面将大概描述一些有代表性的关联结构。关联结构的一个典型应用是,通过选择某一种类的关联结构来定义某一适合特定样本数据分布的联合分布,当然关联结构也可以来自于任何相应的给定联合分布。
基本思想
定义
一个 关联结构是一个定义在 维单位立方体 上的多元联合分布,其每个边缘分布都是在 区间上的均匀分布。
特别的, 是一个n维关联结构,有
- 当 有至少一个分量为
- 当 所有分量为 除了第i个分量等于
- 是n维递增的,也即,有每个hyperrectangle
-
其中 。 所谓的 的C-体积(volume)。
Sklar定理
由Sklar提出的这条定理[1]是大多数关联结构的应用的基础。Sklar定理指出,一个给定的 个变量的联合分布函数 , 为其边缘分布函数,必存在这样一个关联结构 使
以二项分布为例,Sklar定理应用如下。对任一二项分布函数 ,令 而 为其单变量边缘概率分布函数。那么存在关联结构 以使
-
(此处已知分布 和它的累积分布函数)。此外,如果边缘分布 和 连续,那么关联结构函数 是唯一的。否则,关联结构 在边缘分布的值域上是唯一确定的。
弗雷歇–霍夫丁(Fréchet–Hoeffding)关联结构边界
最小(反单调)关联结构:是所有关联结构的下边界。仅在二项分布中,变量间表现为完全负相关。
-
对n-元关联结构,下边界为
-
最大 (共单调 ) 关联结构:是所有关联结构的上边界。其在二项分布中,变量间表现为完全正相关:
-
对n-元关联结构,上边界为
-
结论:对所有关联结构C(u, v),
-
对于多元关联的情况为
-
关联结构种类
正态关联结构
在金融建模中常用到的一个关联结构是正态关联结构,正态关联结构是根据Sklar定理由二元正态分布构成。设 是标准二元正态累积分布函数,相关系数为ρ,则正态关联结构函数为
-
其中, 而 表示标准正态累积分布函数。
对C微分得出关联结构的密度函数:
-
其中
-
是皮尔逊矩相关系数为 标准二元正态分布的概率密度函数,其标准正态密度为 。
参考资料
- ^ Sklar, A. Fonctions de répartition à n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris. 1959, 8: 229–231.