Положительно определённая матрица

В линейной алгебре, положи́тельно определённая ма́трица — это эрмитова матрица, которая во многом аналогична положительному вещественному числу. Это понятие тесно связано с положительно определённой симметрической двулинейной формой (или полуторалинейной формой в случае с комплексными числами).

Содержание

Формулировки

Пусть M{displaystyle M}

  будет эрмитовой матрицей размерности n×n{displaystyle ntimes n} . Обозначим транспонированный вектор a{displaystyle a}  посредством aT{displaystyle a^{T}} , а сопряжённый транспонированный вектор — посредством a∗{displaystyle a^{*}} .

Матрица M{displaystyle M}

  является положительно определённой, если она удовлетворяет любому из следующих равнозначных критериев:

1. Для всех ненулевых комплексных векторов z∈Cn{displaystyle zin mathbb {C} ^{n}} ,
z∗Mz>0.{displaystyle {textbf {z}}^{*}M{textbf {z}}>0.} 

Отметим, что величина z∗Mz{displaystyle z^{*}Mz}

  всегда вещественна, поскольку M{displaystyle M}  — эрмитова матрица.

2. Все собственные значения M{displaystyle M} , λi,i=1,2,…,n{displaystyle lambda _{i},i=1,2,dots ,n} , положительны. Вспомним, что любая эрмитова матрица по теореме о спектральном разложении может быть представлена как вещественная диагональная матрица D{displaystyle D} , переведённая в другую систему координат (то есть M=P−1DP{displaystyle M=P^{-1}DP} , где P{displaystyle P}  — унитарная матрица, строками которой являются ортонормальные собственные векторы M{displaystyle M} , образующие базис). По этому определению M{displaystyle M}  — положительно определённая матрица, если все элементы главной диагонали D{displaystyle D}  (или, другими словами, собственные значения M{displaystyle M} ) положительны. То есть в базисе, состоящем из собственных векторов M{displaystyle M} , действие M{displaystyle M}  на вектор z∈Cn{displaystyle zin mathbb {C} ^{n}}  равносильно покомпонентному умножению z{displaystyle z}  на положительный вектор.
3. Полуторалинейная форма
⟨x,y⟩=x∗My{displaystyle langle {textbf {x}},{textbf {y}}rangle ={textbf {x}}^{*}M{textbf {y}}} 

определяет внутреннее произведение в Cn{displaystyle mathbb {C} ^{n}}

 . Обобщая сказанное, любое внутреннее произведение в Cn{displaystyle mathbb {C} ^{n}}  образуется из эрмитовой положительно определённой матрицы.

4. M{displaystyle M}  — матрица Грама, образованная из множества линейно независимых векторов
x1,…,xn∈Ck{displaystyle {textbf {x}}_{1},ldots ,{textbf {x}}_{n}in mathbb {C} ^{k}} 

для какого-то k{displaystyle k}

 . Другими словами, элементы M{displaystyle M}  определены следующим образом

Mij=⟨xi,xj⟩=xi∗xj.{displaystyle M_{ij}=langle {textbf {x}}_{i},{textbf {x}}_{j}rangle ={textbf {x}}_{i}^{*}{textbf {x}}_{j}.} 

Таким образом, M=A∗A{displaystyle M=A^{*}A}

 , где A{displaystyle A}  инъективная, но не обязательно квадратная матрица.

5. Определители всех угловых миноров матриц положительны (критерий Сильвестра).

В соответствии с этим критерием у положительно полуопределённых матриц все угловые миноры неотрицательны, что, тем не менее, не является достаточным условием для положительной полуопределённости матрицы, как видно из следующего примера

[111111110].{displaystyle {begin{bmatrix}1&1&11&1&11&1&0end{bmatrix}}.} 

Для вещественных симметричных матриц в вышеприведённых свойствах пространство Cn{displaystyle mathbb {C} ^{n}}

  может быть заменено на Rn{displaystyle mathbb {R} ^{n}} , а сопряжённые транспонированные векторы на транспонированные.

Квадратичные формы

Также можно сформулировать положительную определённость через квадратичные формы. Пусть K{displaystyle K}

  будет полем вещественных (R{displaystyle mathbb {R} } ) или комплексных (C{displaystyle mathbb {C} } ) чисел, а V{displaystyle mathbb {V} }  будет векторным пространством над K{displaystyle K} . Эрмитова форма

B:V×V→K{displaystyle B:Vtimes Vrightarrow K} 

является двулинейным отображением, притом числом, сопряженным B(x,y){displaystyle Bleft(x,yright)}

 , будет B(y,x){displaystyle Bleft(y,xright)} . Такая функция B{displaystyle B}  называется положительно определённой, когда B(x,x)>0{displaystyle Bleft(x,xright)>0}  для любого ненулевого x∈V{displaystyle xin V} .

Отрицательно определённая, полуопределённая и неопределённая матрицы

Эрмитова матрица M{displaystyle M}

  размерности n×n{displaystyle ntimes n}  будет называться отрицательно определённой, если

x∗Mx<0{displaystyle x^{*}Mx<0,} 

для всех ненулевых x∈Rn{displaystyle xin mathbb {R} ^{n}}

  (или, эквивалентным образом, для всех ненулевых x∈Cn{displaystyle xin mathbb {C} ^{n}} ).

M{displaystyle M}

  будет называться положительно полуопределённой, если

x∗Mx≥0{displaystyle x^{*}Mxgeq 0} 

для всех x∈Rn{displaystyle xin mathbb {R} ^{n}}

  (или, эквивалентным образом, для всех Cn{displaystyle mathbb {C} ^{n}} ).

M{displaystyle M}

  будет называться отрицательно полуопределённой, если

x∗Mx≤0{displaystyle x^{*}Mxleq 0} 

для всех x∈Rn{displaystyle xin mathbb {R} ^{n}}

  (или, эквивалентным образом, для всех Cn{displaystyle mathbb {C} ^{n}} ).

Таким образом, матрица будет отрицательно определённой, если все её собственные значения отрицательны, положительно полуопределённой, если все её собственные значения неотрицательны, и отрицательно полуопределённой, если все её собственные значения неположительны.

Матрица M{displaystyle M}

  будет положительно полуопределённой тогда и только тогда, когда она является матрицей Грэма какого-нибудь множества векторов. В отличие от положительно определённой матрицы данные векторы не обязательно линейно независимы.

Для любой матрицы A{displaystyle A}

  выполняется следующее: A∗A{displaystyle A^{*}A}  — положительно полуопределённая, а rank⁡(A)=rank⁡(A∗A){displaystyle operatorname {rank} left(Aright)=operatorname {rank} left(A^{*}Aright)} . Обратное утверждение также верно: любая положительно полуопределённая матрица M{displaystyle M}  может быть выражена как M=A∗A{displaystyle M=A^{*}A}  (разложение Холеского).

Эрмитова матрица не являющаяся ни положительно, ни отрицательно полуопределённой называется неопределённой.

Дополнительные свойства

Введём обозначение M⪰0{displaystyle Msucceq 0}

  для положительно полуопределённых матриц и M≻0{displaystyle Msucc 0}  — для положительно определённых матриц.

Для произвольных квадратных матриц M,N{displaystyle M,N}

  будем писать M⪰N{displaystyle Msucceq N} , если M−N⪰0{displaystyle M-Nsucceq 0} , то есть M−N{displaystyle M-N}  положительно полуопределённая матрица. Таким образом, отношение ⪰{displaystyle succeq }  определяет частичный порядок на множестве квадратных матриц. Подобным образом можно определить отношение полного порядка M≻N{displaystyle Msucc N} .

1.

Любая положительно определённая матрица обратима, а её обратная матрица также положительно определённая. Если M⪰N≻0{displaystyle Msucceq Nsucc 0}

 , то N−1⪰M−1≻0{displaystyle N^{-1}succeq M^{-1}succ 0} .

2. Если M{displaystyle M}  — положительно определённая матрица и 0<r∈R{displaystyle 0<rin mathbb {R} } , то r⋅M{displaystyle rcdot M}  положительно определённая матрица.

Если M{displaystyle M}

  and N{displaystyle N}  — положительно определённые матрицы, то их сумма M+N{displaystyle M+N}  и произведения MNM{displaystyle MNM}  и NMN{displaystyle NMN}  тоже положительно определённые. Если MN=NM{displaystyle MN=NM} , то MN{displaystyle MN}  тоже положительно определённая.

3. Если M{displaystyle M}  — положительно определённая матрица, то элементы главной диагонали mii{displaystyle m_{ii}}  положительны. Следовательно, trace⁡(M)>0{displaystyle operatorname {trace} left(Mright)>0} . Более того,
|mij|≤miimjj≤mii+mjj2{displaystyle |m_{ij}|leq {sqrt {m_{ii}m_{jj}}}leq {frac {m_{ii}+m_{jj}}{2}}} .
4. M{displaystyle M}  — положительно определённая матрица тогда и только тогда, когда существует положительно определённая B≻0{displaystyle Bsucc 0}  такая, что B2=M{displaystyle B^{2}=M} . Обозначим B=M12{displaystyle B=M^{frac {1}{2}}} . Такая матрица B{displaystyle B}  единственна при условии, что B≻0{displaystyle Bsucc 0} . Если M≻N≻0{displaystyle Msucc Nsucc 0} , то M12>N12>0{displaystyle M^{frac {1}{2}}>N^{frac {1}{2}}>0} .
5. Если M{displaystyle M}  and N{displaystyle N}  — положительно определённые матрицы, то M⊗N≻0{displaystyle Motimes Nsucc 0}  (где ⊗{displaystyle otimes }  обозначает произведение Кронекера).
6. Если M{displaystyle M}  and N{displaystyle N}  — положительно определённые матрицы, то M∘N≻0{displaystyle Mcirc Nsucc 0}  (где ∘{displaystyle circ }  обозначает произведение Адамара). Когда M,N{displaystyle M,N}  вещественные матрицы, выполняется также следующее неравенство (неравенство Оппенхейма):

det(M∘N)≥(detN)∏imii{displaystyle det(Mcirc N)geq (det N)prod _{i}m_{ii}}

 .

7. Если M{displaystyle M}  — положительно определённая матрица, а N{displaystyle N}  — эрмитова матрица и MN+NM⪰0{displaystyle MN+NMsucceq 0}  (MN+NM≻0){displaystyle left(MN+NMsucc 0right)} , то N⪰0{displaystyle Nsucceq 0}  (N≻0){displaystyle left(Nsucc 0right)} .
8. Если M{displaystyle M}  and N{displaystyle N}  — положительно полуопределённые вещественные матрицы, то trace⁡(MN)⪰0{displaystyle operatorname {trace} left(MNright)succeq 0} .
9. Если M{displaystyle M}  — положительно определённая вещественная матрица, то существует число δ>0{displaystyle delta >0}  такое, что M⪰δI{displaystyle Msucceq delta I} , где I{displaystyle I}  — единичная матрица.

Неэрмитовы матрицы

Вещественные несимметрические матрицы тоже могут удовлетворять неравенству xTMx>0{displaystyle x^{T}Mx>0}

  для всех ненулевых вещественных векторов x{displaystyle x} . Такой, к примеру, является матрица

[11−11],{displaystyle {begin{bmatrix}1&1-1&1end{bmatrix}},} 

поскольку для всех ненулевых вещественных векторов x=(x1,x2)T{displaystyle x=(x_{1},x_{2})^{T}}

 

[x1x2][11−11][x1x2]=x12+x22>0.{displaystyle {begin{bmatrix}x_{1}&x_{2}end{bmatrix}}{begin{bmatrix}1&1-1&1end{bmatrix}}{begin{bmatrix}x_{1}x_{2}end{bmatrix}}=x_{1}^{2}+x_{2}^{2}>0.} 

Обобщая, xTMx>0{displaystyle x^{T}Mx>0}

  для всех ненулевых вещественных векторов x{displaystyle x}  тогда и только тогда, когда симметрическая часть M+MT2{displaystyle {frac {M+M^{T}}{2}}}  положительно определённая.

Для комплексных матриц существет несколько обобщений неравенства x∗Mx>0{displaystyle x^{*}Mx>0}

 . Если x∗Mx>0{displaystyle x^{*}Mx>0}  для всех ненулевых комплексных векторов x{displaystyle x} , тогда матрица M{displaystyle M}  эрмитова. То есть если x∗Mx>0{displaystyle x^{*}Mx>0} , то M{displaystyle M}  эрмитова. С другой стороны, Re⁡(x∗Mx)>0{displaystyle operatorname {Re} left(x^{*}Mxright)>0}  для всех ненулевых комплексных векторов x{displaystyle x}  тогда и только тогда, когда эрмитова часть M+M∗2{displaystyle {frac {M+M^{*}}{2}}}  положительно определённая.

Литература

  • R. A. Horn, C. R. Johnson. Matrix Analysis, Cambridge University Press, Ch. 7, 1985.
  • R. Bhatia, Positive definite matrices, Princeton Series in Applied Mathematics, 2007.

См. также