定义
正定矩陣
对於
n
×
n
{\displaystyle n\times n}
的埃尔米特矩阵
M
{\displaystyle M}
,下列性质与「
M
{\displaystyle M}
为正定矩阵」等价:
M
{\displaystyle M}
的所有的特征值
λ
i
{\displaystyle \lambda _{i}}
都是正的。 根据
谱定理 ,
M
{\displaystyle M}
与一个实
对角矩阵
D
{\displaystyle D}
相似 (也就是说
M
=
U
−
1
D
U
{\displaystyle M=U^{-1}DU}
,其中
U
{\displaystyle U}
是
酉矩阵 ,或者说
M
{\displaystyle M}
在某个
正交基 可以表示为一个实
对角矩阵 )。因此,
M
{\displaystyle M}
是正定阵当且仅当相应的
D
{\displaystyle D}
的对角线上元素都是正的。 另外,也可以假設
λ
i
{\displaystyle \lambda _{i}}
和
v
i
{\displaystyle \mathbf {v} _{i}}
是
M
{\displaystyle M}
的一組特徵值與特徵向量,根據定義
M
v
i
=
λ
i
v
i
{\displaystyle M\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}}
,從左側同乘以
v
i
∗
{\displaystyle \mathbf {v} _{i}^{*}}
得到:
v
i
∗
M
v
i
=
λ
i
v
i
∗
v
i
=
λ
i
‖
v
i
‖
2
{\displaystyle \mathbf {v} _{i}^{*}M\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}^{*}\mathbf {v} _{i}=\lambda _{i}\Vert \mathbf {v} _{i}\Vert ^{2}}
。因為
M
{\displaystyle M}
是正定矩陣,根據定義我們有
v
i
∗
M
v
>
0
{\displaystyle \mathbf {v} _{i}^{*}M\mathbf {v} >0}
。移項整理後可以得到
λ
i
=
v
∗
M
v
‖
v
i
‖
2
>
0
{\displaystyle \lambda _{i}={\frac {\mathbf {v} ^{*}M\mathbf {v} }{\Vert \mathbf {v} _{i}\Vert ^{2}}}>0}
。注意因為特徵向量
v
i
≠
0
{\displaystyle \mathbf {v} _{i}\neq \mathbf {0} }
,所以前述
λ
i
{\displaystyle \lambda _{i}}
不會有無解的情形。
半双线性形式
⟨
x
,
y
⟩
=
x
∗
M
y
{\displaystyle \langle {\textbf {x}},{\textbf {y}}\rangle ={\textbf {x}}^{*}M{\textbf {y}}}
定义了一个
C
n
{\displaystyle \mathbb {C} ^{n}}
上的内积 。实际上,所有
C
n
{\displaystyle \mathbb {C} ^{n}}
上的内积都可視為由某个正定矩阵通过此种方式得到。
M
{\displaystyle M}
是向量
x
1
,
…
,
x
n
∈
C
k
{\displaystyle {\textbf {x}}_{1},\ldots ,{\textbf {x}}_{n}\in \mathbb {C} ^{k}}
構成的格拉姆矩阵 ,其中
k
∈
Z
+
{\displaystyle k\in \mathbb {Z} ^{+}}
。更精确地说,
M
=
[
m
i
j
]
{\displaystyle M=[m_{ij}]}
定义为:
m
i
j
=
⟨
x
i
,
x
j
⟩
=
x
i
∗
x
j
{\displaystyle m_{ij}=\langle {\textbf {x}}_{i},{\textbf {x}}_{j}\rangle ={\textbf {x}}_{i}^{*}{\textbf {x}}_{j}}
。换句话说,
M
{\displaystyle M}
具有
A
∗
A
{\displaystyle A^{*}A}
的形式,其中
A
{\displaystyle A}
不一定是方阵,但必須是单射的。
M
{\displaystyle M}
的所有顺序主子式 ,也就是顺序主子阵 的行列式 都是正的(西尔维斯特准则 )。明确地说,就是考察
M
{\displaystyle M}
左上角大小
1
×
1
,
…
,
n
×
n
{\displaystyle 1\times 1,\ldots ,n\times n}
的子矩阵的行列式。对于半正定矩阵而言,相应的条件应改为所有的主子式非负。但顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:
[
1
1
1
1
1
1
1
1
0
]
{\displaystyle {\begin{bmatrix}1&1&1\\1&1&1\\1&1&0\end{bmatrix}}}
存在唯一的下三角矩阵
L
{\displaystyle L}
,其主对角线上的元素全是正的,使得
M
=
L
L
∗
{\displaystyle M=LL^{*}}
。其中
L
∗
{\displaystyle L^{*}}
是
L
{\displaystyle L}
的共轭转置 。这一分解被称为科列斯基分解 。
对于实对称矩阵 ,只需将上述性质中的
C
n
{\displaystyle \mathbb {C} ^{n}}
改为
R
n
{\displaystyle \mathbb {R} ^{n}}
,並将「共轭转置」改为「转置」即可。
二次型
由以上的第二个等价条件,可以得到二次型 形式下正定矩阵的等价条件:用
K
{\displaystyle \mathbb {K} }
代表
C
{\displaystyle \mathbb {C} }
或
R
{\displaystyle \mathbb {R} }
,设
V
{\displaystyle \mathbb {V} }
是
K
{\displaystyle \mathbb {K} }
上的一个向量空间 。一个埃尔米特型 :
B
:
V
×
V
→
K
{\displaystyle B:V\times V\rightarrow K}
是一个双线性映射 ,使得
B
(
x
,
y
)
{\displaystyle B(\mathbf {x} ,\mathbf {y} )}
总是
B
(
y
,
x
)
{\displaystyle B(\mathbf {y} ,\mathbf {x} )}
的共轭 。这样的一个映射
B
{\displaystyle B}
是正定 的若且唯若對於
V
{\displaystyle \mathbb {V} }
中所有的非零向量
x
{\displaystyle \mathbf {x} }
,都有
B
(
x
,
x
)
>
0
{\displaystyle B(\mathbf {x} ,\mathbf {x} )>0}
。
负定、半定及不定矩阵
相关性质
若
M
{\displaystyle M}
为半正定矩阵,可以記作
M
≥
0
{\displaystyle M\geq 0}
。如果
M
{\displaystyle M}
是正定矩阵,可以記作
M
>
0
{\displaystyle M>0}
。这个记法来自泛函分析 ,其中的正定矩阵定义了正算子。
对于一般的埃尔米特矩阵,
M
{\displaystyle M}
、
N
{\displaystyle N}
,
M
≥
N
{\displaystyle M\geq N}
若且唯若
M
−
N
≥
0
{\displaystyle M-N\geq 0}
。这样可以定义一个在埃尔米特矩阵集合上的偏序关系 。类似地,可以定义
M
>
N
{\displaystyle M>N}
。
1.
每个正定阵都是可逆的 ,它的逆也是正定阵。如果
M
≥
N
>
0
{\displaystyle M\geq N>0}
那么
N
−
1
≥
M
−
1
>
0
{\displaystyle N^{-1}\geq M^{-1}>0}
。
2.
如果
M
{\displaystyle M}
是正定阵,
r
>
0
{\displaystyle r>0}
为正实数,那么
r
M
{\displaystyle rM}
也是正定阵。
如果
M
{\displaystyle M}
、
N
{\displaystyle N}
是正定阵,那么
M
+
N
{\displaystyle M+N}
、
M
N
M
{\displaystyle MNM}
与
N
M
N
{\displaystyle NMN}
都是正定的。如果
M
N
=
N
M
{\displaystyle MN=NM}
,那么
M
N
{\displaystyle MN}
仍是正定阵。
3.
如果
M
=
(
m
i
j
)
>
0
{\displaystyle M=(m_{ij})>0}
那么主对角线上的元素
m
i
i
{\displaystyle m_{ii}}
为正实数。于是有
tr
(
M
)
>
0
{\displaystyle {\text{tr}}(M)>0}
。此外还有
|
m
i
j
|
≤
m
i
i
m
j
j
≤
m
i
i
+
m
j
j
2
{\displaystyle |m_{ij}|\leq {\sqrt {m_{ii}m_{jj}}}\leq {\frac {m_{ii}+m_{jj}}{2}}}
。
4.
矩阵
M
{\displaystyle M}
是正定阵若且唯若存在唯一的正定阵
B
>
0
{\displaystyle B>0}
使得
B
2
=
M
{\displaystyle B^{2}=M}
。根据其唯一性可以记作
B
=
M
1
/
2
{\displaystyle B=M^{1/2}}
,称
B
{\displaystyle B}
为
M
{\displaystyle M}
的平方根。对半正定阵也有类似结论。同时,如果
M
>
N
>
0
{\displaystyle M>N>0}
那么
M
1
/
2
>
N
1
/
2
>
0
{\displaystyle M^{1/2}>N^{1/2}>0}
。
5.
如果
M
,
N
>
0
{\displaystyle M,N>0}
那么
M
⊗
N
>
0
{\displaystyle M\otimes N>0}
,其中
⊗
{\displaystyle \otimes }
表示克羅內克積 。
6.
对矩阵
M
=
(
m
i
j
)
,
N
=
(
n
i
j
)
{\displaystyle M=(m_{ij}),\ N=(n_{ij})}
,将两者同一位置上的系数相乘所得的矩阵记为
M
∘
N
{\displaystyle M\circ N}
,即
(
M
∘
N
)
i
,
j
=
m
i
j
n
i
j
{\displaystyle (M\circ N)_{i,j}=m_{ij}n_{ij}}
,称为
M
{\displaystyle M}
与
N
{\displaystyle N}
的 阿达马乘积 。如果
M
,
N
>
0
{\displaystyle M,N>0}
,那么
M
∘
N
>
0
{\displaystyle M\circ N>0}
。如果
M
,
N
{\displaystyle M,N}
为实係数矩阵 ,则以下不等式成立:
det
(
M
∘
N
)
≥
(
det
N
)
∏
i
m
i
i
{\displaystyle \det(M\circ N)\geq (\det N)\prod _{i}m_{ii}}
。
7.
设
M
>
0
{\displaystyle M>0}
,
N
{\displaystyle N}
为埃尔米特矩阵。如果
M
N
+
N
M
≥
0
{\displaystyle MN+NM\geq 0}
(相應地,
M
N
+
N
M
>
0
{\displaystyle MN+NM>0}
),那么
N
≥
0
{\displaystyle N\geq 0}
(相應地,
N
>
0
{\displaystyle N>0}
)。
8.
如果
M
,
N
≥
0
{\displaystyle M,N\geq 0}
为实系数矩阵,则
tr
(
M
N
)
≥
0
{\displaystyle {\text{tr}}(MN)\geq 0}
。
9.
如果
M
>
0
{\displaystyle M>0}
为实系数矩阵,那么存在
δ
>
0
{\displaystyle \delta >0}
使得
M
≥
δ
I
{\displaystyle M\geq \delta I}
,其中
I
{\displaystyle I}
为单位矩阵 。
非埃尔米特矩阵的情况
参见
参考资料
Roger A. Horn and Charles R. Johnson. Matrix Analysis, Chapter 7. Cambridge University Press, 1985. ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (paperback).
Rajendra Bhatia. Positive definite matrices, . Princeton Series in Applied Mathematics, 2007. ISBN 978-0691129181 .
外部链接