中心化矩陣

數學多元變量統計中,中心化矩陣[1]對稱冪等矩陣,且當其與向量相乘時,效果等用於從向量的每個分量中減去分量的平均值

定義

大小為n的中心化矩陣是n×n的

 

其中 單位矩陣 是n×n一矩陣。例如

 ,
  ,
 

性質

給定長為n的列向量  中心性可表為

 

其中 值全為1的列向量  的分量的平均值。

  •  是正半定對稱陣。
  •  冪等矩陣,所以 。均值被移除的話它就是零,再次移除也沒有任何影響。
  •  奇異矩陣/不可逆矩陣。應用 變換的效果無法逆轉。
  •  具有重數為n-1的特徵值1與重數為1的特徵值0
  •  沿向量 有維度為1的零空間
  •  正交投影矩陣。也就是說  在n-1維線性子空間上的投影,其與零空間 正交(這是所有分量和為0的n向量構成的子空間)。
  •  的跡是 

應用

雖然與中心化矩陣相乘並不是去除向量均值的有效計算方法,但卻是一種方便的分析工具。它不僅可用來去除單個向量的均值,還可去除存儲在m×n矩陣 的行或列中多個向量的均值。

左乘 將從n列的每一列減去相應的均值,這樣積 的每列的均值都是0。相似地,右乘 會從每行減去相應的均值,這樣積 的每行均值都為0。兩側均乘: 將產生行列均值均為0的矩陣。

中心化矩陣提供了一種表示散佈矩陣的方法:對數據樣本 ,有 ,其中 樣本均值。有了中心化矩陣,可以將散佈矩陣更簡潔地表示為

 

 多項分佈協方差矩陣,在特殊情況下分佈參數為  

參考文獻

  1. ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.