定義
性質
給定長為n的列向量 , 的中心性可表為
-
其中 是值全為1的列向量, 是 的分量的平均值。
- 是正半定對稱陣。
- 是冪等矩陣,所以 。均值被移除的話它就是零,再次移除也沒有任何影響。
- 是奇異矩陣/不可逆矩陣。應用 變換的效果無法逆轉。
- 具有重數為n-1的特徵值1與重數為1的特徵值0
- 沿向量 有維度為1的零空間。
- 是正交投影矩陣。也就是說 是 在n-1維線性子空間上的投影,其與零空間 正交(這是所有分量和為0的n向量構成的子空間)。
- 的跡是 。
應用
雖然與中心化矩陣相乘並不是去除向量均值的有效計算方法,但卻是一種方便的分析工具。它不僅可用來去除單個向量的均值,還可去除存儲在m×n矩陣 的行或列中多個向量的均值。
左乘 將從n列的每一列減去相應的均值,這樣積 的每列的均值都是0。相似地,右乘 會從每行減去相應的均值,這樣積 的每行均值都為0。兩側均乘: 將產生行列均值均為0的矩陣。
中心化矩陣提供了一種表示散佈矩陣的方法:對數據樣本 ,有 ,其中 是樣本均值。有了中心化矩陣,可以將散佈矩陣更簡潔地表示為
-
是多項分佈的協方差矩陣,在特殊情況下分佈參數為 , 。
參考文獻
- ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.