Матрица (математика)

У этого термина существуют и другие значения, см. Матрица.

Ма́трица — математический объект, записываемый в виде прямоугольной таблицы элементов кольца или поля (например, целых, действительных или комплексных чисел), которая представляет собой совокупность строк и столбцов, на пересечении которых находятся её элементы. Количество строк и столбцов задает размер матрицы. Хотя исторически рассматривались, например, треугольные матрицы[1], в настоящее время говорят исключительно о матрицах прямоугольной формы, так как они являются наиболее удобными и общими.

Матрицы широко применяются в математике для компактной записи систем линейных алгебраических или дифференциальных уравнений. В этом случае количество строк матрицы соответствует числу уравнений, а количество столбцов — количеству неизвестных. В результате решение систем линейных уравнений сводится к операциям над матрицами.

Для матрицы определены следующие алгебраические операции:

  • сложение матриц, имеющих один и тот же размер[⇨];
  • умножение матриц подходящего размера (матрицу, имеющую n{displaystyle n} столбцов, можно умножить справа на матрицу, имеющую n{displaystyle n} строк)[⇨];
  • в том числе умножение на матрицу вектора (по обычному правилу матричного умножения; вектор является в этом смысле частным случаем матрицы)[⇨];
  • умножение матрицы на элемент основного кольца или поля (то есть скаляр)[⇨].

Относительно сложения матрицы образуют абелеву группу; если же рассматривать ещё и умножение на скаляр, то матрицы образуют модуль над соответствующим кольцом (векторное пространство над полем). Множество квадратных матриц замкнуто относительно матричного умножения, поэтому квадратные матрицы одного размера образуют ассоциативное кольцо с единицей относительно матричного сложения и матричного умножения.

Доказано, что каждому линейному оператору, действующему в n-мерном линейном пространстве, можно сопоставить единственную квадратную матрицу порядка n; и обратно — каждой квадратной матрице порядка n может быть сопоставлен единственный линейный оператор, действующий в этом пространстве.[2] Свойства матрицы соответствуют свойствам линейного оператора. В частности, собственные числа матрицы — это собственные числа оператора, отвечающие соответствующим собственным векторам.

То же можно сказать о представлении матрицами билинейных (квадратичных) форм.

В математике рассматривается множество различных типов и видов матриц. Таковы, например, единичная, симметричная, кососимметричная, верхнетреугольная (нижнетреугольная) и т. п. матрицы.

Особое значение в теории матриц занимают всевозможные нормальные формы, то есть канонический вид, к которому можно привести матрицу заменой координат. Наиболее важной (в теоретическом значении) и проработанной является теория жордановых нормальных форм. На практике, однако, используются такие нормальные формы, которые обладают дополнительными свойствами, например, устойчивостью.

Содержание

История

Впервые матрицы упоминались ещё в древнем Китае, называясь тогда «волшебным квадратом». Основным применением матриц было решение линейных уравнений[3]. Также волшебные квадраты были известны чуть позднее у арабских математиков, примерно тогда появился принцип сложения матриц.После развития теории определителей в конце 17-го века Габриэль Крамер начал разрабатывать свою теорию в 18-м столетии и опубликовал «правило Крамера» в 1751 году. Примерно в этом же промежутке времени появился «метод Гаусса».Теория матриц начала своё существование в середине XIX века в работах Уильяма Гамильтона и Артура Кэли.Фундаментальные результаты в теории матриц принадлежат Вейерштрассу, Жордану, Фробениусу.Термин «матрица» ввел Джеймс Сильвестр в 1850 г.[4]

Введение

Матрицы естественным образом возникают при решении систем линейных уравнений, а также при рассмотрении линейных преобразований.

Системы линейных уравнений

Основная статья: Система линейных алгебраических уравнений

Рассмотрим систему линейных уравнений вида:

{a11x1+a12x2+…+a1nxn=b1a21x1+a22x2+…+a2nxn=b2⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯am1x1+am2x2+…+amnxn=bm{displaystyle {begin{cases}a_{11}x_{1}+a_{12}x_{2}+ldots +a_{1n}x_{n}=b_{1}a_{21}x_{1}+a_{22}x_{2}+ldots +a_{2n}x_{n}=b_{2}cdots cdots cdots cdots cdots cdots cdots cdots cdots cdots a_{m1}x_{1}+a_{m2}x_{2}+ldots +a_{mn}x_{n}=b_{m}end{cases}}} .

Эта система состоит из m{displaystyle m}

  линейных уравнений относительно n{displaystyle n}  неизвестных. Она может быть записана в виде следующего матричного уравнения :

Ax=b{displaystyle Ax=b} ,

где

A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮am1am2⋯amn);x=(x1x2⋮xn);b=(b1b2⋮bm){displaystyle A={begin{pmatrix}a_{11}&a_{12}&cdots &a_{1n}a_{21}&a_{22}&cdots &a_{2n}vdots &vdots &ddots &vdots a_{m1}&a_{m2}&cdots &a_{mn}end{pmatrix}};quad x={begin{pmatrix}x_{1}x_{2}vdots x_{n}end{pmatrix}};quad b={begin{pmatrix}b_{1}b_{2}vdots b_{m}end{pmatrix}}} 

Матрица A{displaystyle A}

  — это матрица коэффициентов системы линейных уравнений, вектор-столбец x{displaystyle x}  — вектор неизвестных, а вектор-столбец b{displaystyle b}  — некоторый заданный вектор.

Для того, чтобы система имела решение (хотя бы одно), необходимо и достаточно, чтобы вектор b{displaystyle b}

  был линейной комбинацией столбцов A{displaystyle A} , и тогда вектор x{displaystyle x}  — это вектор, содержащий коэффициенты разложения вектора b{displaystyle b}  по столбцам матрицыA{displaystyle A} .

На языке матриц условие разрешимости системы линейных уравнений формулируется в виде теоремы Кронекера-Капелли:

ранг матрицы A{displaystyle A}  равен рангу расширенной матрицы [A|b]{displaystyle [A|b]} ,

составленной из столбцов A{displaystyle A}

  и столбца b{displaystyle b} .

Важный частный случай. Если количество уравнений совпадает с количеством неизвестных (m=n{displaystyle m=n}

 , т.е. матрица A{displaystyle A}  — квадратная), то условие однозначной разрешимости является равносильным условию обратимости матрицы A{displaystyle A} .

(Замечание. Разрешимость системы ещё не влечёт невырожденности матрицы. Пример: 0x=0{displaystyle 0x=0}

 .)

В частности, если матрица A{displaystyle A}

  является обратимой, то решение системы может быть записано (а если вычислена A−1{displaystyle A^{-1}} , то и найдено) в виде

x=A−1b{displaystyle x=A^{-1}b} .

Этот приводит к алгоритму вычисления значений неизвестных по правилу Крамера.

Линейные преобразования

Основная статья: Линейное отображение

Рассмотрим линейное преобразование A:Rn→Rm{displaystyle {mathcal {A}}colon mathbb {R} ^{n}to mathbb {R} ^{m}}

 , действующее из n{displaystyle n} -мерного векторного пространства Rn{displaystyle mathbb {R} ^{n}}  в m{displaystyle m} -мерное векторное пространство Rm{displaystyle mathbb {R} ^{m}} , имеющее следующий вид:

{y1=a11x1+a12x2+…+a1nxny2=a21x1+a22x2+…+a2nxn⋯ym=am1x1+am2x2+…+amnxn{displaystyle left{{begin{array}{rcl}y_{1}&=&a_{11}x_{1}+a_{12}x_{2}+ldots +a_{1n}x_{n}y_{2}&=&a_{21}x_{1}+a_{22}x_{2}+ldots +a_{2n}x_{n}&cdots &y_{m}&=&a_{m1}x_{1}+a_{m2}x_{2}+ldots +a_{mn}x_{n}end{array}}right.} .

В матричной форме это преобразование уравнения вида:

y=Ax{displaystyle y=Ax} .

Матрица A{displaystyle A}

  — это матрица коэффициентов линейного преобразования.

Если рассмотреть действие линейного преобразования A{displaystyle {mathcal {A}}}

  на векторы вида

ej=(0,…,0,1j,0,…,0)T,j=1,n¯{displaystyle e_{j}=(0,dots ,0,1_{j},0,dots ,0)^{T},quad j={overline {1,n}}} ,

составляющие базис пространства Rn{displaystyle mathbb {R} ^{n}}

 , то Aej{displaystyle {mathcal {A}}mathbf {e} _{j}}  — это есть j-ый столбец матрицы A{displaystyle A} .

Таким образом, матрица A{displaystyle A}

  полностью описывает линейное преобразование A{displaystyle {mathcal {A}}} , и, поэтому, называется матрицей линейного преобразования.

Определения

Прямоугольная матрица

Пусть есть два конечных множества:

  • номера строк: M={1,2,…,m}{displaystyle M={1,2,dots ,m}} ;
  • номера столбцов: N={1,2,…,n}{displaystyle N={1,2,dots ,n}} , где m{displaystyle m}  и n{displaystyle n}  — натуральные числа.

Назовём матрицей A{displaystyle A}

  размера m×n{displaystyle mtimes n}  (читается m{displaystyle m}  на n{displaystyle n} ) (m{displaystyle m}  — строк, n{displaystyle n}  — столбцов) с элементами из некоторого кольца или поля K{displaystyle {mathcal {K}}}  отображение вида A:M×N→K{displaystyle Acolon Mtimes Nto {mathcal {K}}} . Матрица записывается как

A=(a11a12⋯a1na21a22⋯a2n⋮⋮aij⋮am1am2⋯amn),{textstyle A={begin{pmatrix}a_{11}&a_{12}&cdots &a_{1n}a_{21}&a_{22}&cdots &a_{2n}vdots &vdots &a_{ij}&vdots a_{m1}&a_{m2}&cdots &a_{mn}end{pmatrix}},} 

где элемент матрицы aij=a(i,j){displaystyle a_{ij}=a(i,j)}

  находится на пересечении i{displaystyle i} -й строки и j{displaystyle j} -го столбца.

  • i{displaystyle i} -я строка матрицы A(i,)=(ai1ai2⋯ain);{textstyle A(i,)={begin{pmatrix}a_{i1}&a_{i2}&cdots &a_{in}end{pmatrix}};} 
  • j{displaystyle j} -й столбец матрицы A(,j)=(a1ja2j⋮amj).{textstyle A(,j)={begin{pmatrix}a_{1j}a_{2j}vdots a_{mj}end{pmatrix}}.} 

При этом количество элементов матрицы равно m⋅n{displaystyle mcdot n}

 .

В соответствии с этим

  • каждую строку матрицы можно интерпретировать как вектор в n{displaystyle n} -мерном координатном пространстве Kn{displaystyle {mathcal {K}}^{n}} ;
  • каждый столбец матрицы — как вектор в m{displaystyle m} -мерном координатном пространстве Km{displaystyle {mathcal {K}}^{m}} .

Сама матрица естественным образом интерпретируется как вектор в пространстве Kmn{displaystyle {mathcal {K}}^{mn}}

 , имеющем размерность mn{displaystyle mn} . Это позволяет ввести покомпонентное сложение матриц и умножение матрицы на число (см. ниже); что касается матричного умножения, то оно существенным образом опирается на прямоугольную структуру матрицы.

Квадратная матрица

Если у матрицы количество строк m{displaystyle m}

  совпадает с количеством столбцов n{displaystyle n} , то такая матрица называется квадратной, а число m=n{displaystyle m=n}  называется размером квадратной матрицы или её порядком.

Вектор-строка и вектор-столбец

Матрицы размера m×1{displaystyle mtimes 1}

  и 1×n{displaystyle 1times n}  являются элементами пространств Km{displaystyle {mathcal {K}}^{m}}  и Kn{displaystyle {mathcal {K}}^{n}}  соответственно:

  • матрица размера m×1{displaystyle mtimes 1}  называется вектор-столбцом и имеет специальное обозначение:
colon(a1,…,ai,…,am)=(a1⋮ai⋮am)=(a1,…,ai,…,am)T;{displaystyle mathrm {colon} ,(a_{1},dots ,a_{i},dots ,a_{m})=left({begin{array}{c}a_{1}vdots a_{i}vdots a_{m}end{array}}right)=(a_{1},dots ,a_{i},dots ,a_{m})^{T};} 
  • матрица размера 1×n{displaystyle 1times n}  называется вектор-строкой и имеет специальное обозначение:
row(a1,…,ai,…,an)=(a1,…,ai,…,an);{displaystyle mathrm {row} ,(a_{1},dots ,a_{i},dots ,a_{n})=(a_{1},dots ,a_{i},dots ,a_{n});} 

Элементарные преобразования матриц

Основная статья: Элементарные преобразования матрицы

Элементарными преобразованиями строк матрицы называются следующие преобразования:

  1. Умножение строки на число отличное от нуля,
  2. Прибавление одной строки к другой строке,
  3. Перестановка местами двух строк.

Элементарные преобразования столбцов матрицы определяются аналогично.

Ранг матрицы

Основная статья: Ранг матрицы

Строки и столбцы матрицы являются элементами соответствующих векторных пространств:

  • столбцы матрицы A{displaystyle A}  составляют элементы пространства размерности m{displaystyle m} ;
  • строки матрицы A{displaystyle A}  составляют элементы пространства размерности n{displaystyle n} .

Рангом матрицы называют количество линейно независимых столбцов матрицы (столбцовый ранг матрицы) или количество линейно независимых строк матрицы (строчный ранг матрицы). Этому определению эквивалентно определение ранга матрицы как порядка максимального отличного от нуля минора матрицы.

При элементарных преобразованиях ранг матрицы не меняется.

Обозначения

Обычно матрицу обозначают заглавной буквой латинского алфавита: пусть

A:M×N→K,{displaystyle Acolon Mtimes Nto {mathcal {K}},} 

тогда A{displaystyle A}

  — матрица, которая интерпретируется как прямоугольный массив элементов поля K{displaystyle {mathcal {K}}}  вида aij=A(i,j){displaystyle a_{ij}=A(i,j)} , где

  • первый индекс означает индекс строки: i=1,m¯{displaystyle i={overline {1,m}}} ;
  • второй индекс означает индекс столбца: j=1,n¯{displaystyle j={overline {1,n}}} ;

таким образом, aij{displaystyle a_{ij}}

  — элемент матрицы A{displaystyle A} , находящийся на пересечении i{displaystyle i} -й строки и j{displaystyle j} -го столбца. В соответствии с этим принято следующее компактное обозначение для матрицы размера m×n{displaystyle mtimes n} :

A=(aij)i=1,j=1m,n,{displaystyle A=(a_{ij})_{i=1,j=1}^{m,n},} 

или просто

A=(aij),{displaystyle A=(a_{ij}),} 

если нужно просто указать обозначение для элементов матрицы.

Иногда, вместо aij{displaystyle a_{ij}}

 , пишут ai,j{displaystyle a_{i,j}} , чтобы отделить индексы друг от друга и избежать смешения с произведением двух чисел.

Если необходимо дать развёрнутое представление матрицы в виде таблицы, то используют запись вида

(a11⋯a1j⋯a1n⋮⋱⋮⋱⋮ai1⋯aij⋯ain⋮⋱⋮⋱⋮am1⋯amj⋯amn),[a11⋯a1j⋯a1n⋮⋱⋮⋱⋮ai1⋯aij⋯ain⋮⋱⋮⋱⋮am1⋯amj⋯amn],‖a11⋯a1j⋯a1n⋮⋱⋮⋱⋮ai1⋯aij⋯ain⋮⋱⋮⋱⋮am1⋯amj⋯amn‖{displaystyle {begin{pmatrix}a_{11}&cdots &a_{1j}&cdots &a_{1n}vdots &ddots &vdots &ddots &vdots a_{i1}&cdots &a_{ij}&cdots &a_{in}vdots &ddots &vdots &ddots &vdots a_{m1}&cdots &a_{mj}&cdots &a_{mn}end{pmatrix}},quad left[{begin{array}{ccccc}a_{11}&cdots &a_{1j}&cdots &a_{1n}vdots &ddots &vdots &ddots &vdots a_{i1}&cdots &a_{ij}&cdots &a_{in}vdots &ddots &vdots &ddots &vdots a_{m1}&cdots &a_{mj}&cdots &a_{mn}end{array}}right],quad left|{begin{array}{ccccc}a_{11}&cdots &a_{1j}&cdots &a_{1n}vdots &ddots &vdots &ddots &vdots a_{i1}&cdots &a_{ij}&cdots &a_{in}vdots &ddots &vdots &ddots &vdots a_{m1}&cdots &a_{mj}&cdots &a_{mn}end{array}}right|} 

Можно встретить как обозначения с круглыми скобками «(…)», так и обозначения с квадратными скобками «[…]». Реже можно встретить обозначения с двойными прямыми линиями «||…||»).

Поскольку матрица состоит из строк и столбцов, для них используются следующие обозначения:

ai⋅=Ai=[ai1⋯aij⋯ain]{displaystyle a_{icdot }=A_{i}=[{begin{array}{ccccc}a_{i1}&cdots &a_{ij}&cdots &a_{in}end{array}}]}  — это i{displaystyle i} -я строка матрицы A{displaystyle A} ,

а

a⋅j=Aj=[a1j⋮aij⋮amj]{displaystyle a_{cdot j}=A^{j}=left[{begin{array}{c}a_{1j}vdots a_{ij}vdots a_{mj}end{array}}right]}  — это j{displaystyle j} -й столбец матрицы A{displaystyle A} .

Таким образом, матрица обладает двойственным представлением — по столбцам:

A=[A1⋯Aj⋯An]{displaystyle A=[{begin{array}{ccccc}A^{1}&cdots &A^{j}&cdots &A^{n}end{array}}]} 

и по строкам:

A=[A1⋮Ai⋮Am]{displaystyle A=left[{begin{array}{c}A_{1}vdots A_{i}vdots A_{m}end{array}}right]} .

Такое представление позволяет формулировать свойства матриц в терминах строк или в терминах столбцов.

Транспонированная матрица

Основная статья: Транспонированная матрица

Для каждой матрицы A=(ai,j)i=1,m¯j=1,n¯=(a1,1⋯a1,n⋮⋱⋮am,1⋯am,n){displaystyle A=(a_{i,j})_{begin{smallmatrix}i={overline {1,m}}j={overline {1,n}}end{smallmatrix}}={begin{pmatrix}a_{1,1}&cdots &a_{1,n}vdots &ddots &vdots a_{m,1}&cdots &a_{m,n}end{pmatrix}}}

  размера m×n{displaystyle mtimes n} 

можно построить матрицу B=(bj,i)j=1,n¯i=1,m¯=(b1,1⋯b1,m⋮⋱⋮bn,1⋯bn,m){displaystyle B=(b_{j,i})_{begin{smallmatrix}j={overline {1,n}}i={overline {1,m}}end{smallmatrix}}={begin{pmatrix}b_{1,1}&cdots &b_{1,m}vdots &ddots &vdots b_{n,1}&cdots &b_{n,m}end{pmatrix}}}

  размера n×m{displaystyle ntimes m} ,

у которой bj,i=ai,j{displaystyle b_{j,i}=a_{i,j}}

  для всех i=1,m¯{displaystyle i={overline {1,m}}}  и j=1,n¯{displaystyle j={overline {1,n}}} .

Такая матрица называется транспонированной матрицей для A{displaystyle A}

  и обозначается AT{displaystyle A^{T}} ,

иногда (если нет возможности спутать с дифференцированием) обозначается A′{displaystyle A’}

 ,

иногда (если нет возможности спутать с эрмитовым сопряжением) обозначается A∗{displaystyle A^{*}}

 .

При транспонировании строки (столбцы) матрицы A{displaystyle A}

  становятся столбцами (соответственно — строками) матрицы AT{displaystyle A^{T}} .

Очевидно, (AT)T=A{displaystyle (A^{T})^{T}=A}

 .

Для матриц над кольцом K{displaystyle {mathcal {K}}}

  транспонирование является изоморфизмом K{displaystyle {mathcal {K}}}  — модулей матриц, поскольку

(A+B)T=AT+BT{displaystyle (A+B)^{T}=A^{T}+B^{T}} ,
(λ⋅A)T=λ⋅(AT){displaystyle (lambda cdot A)^{T}=lambda cdot (A^{T})} , для любых λ∈K{displaystyle lambda in {mathcal {K}}} .

Диагональная матрица

Диагональная матрица — квадратная матрица, все элементы которой кроме диагональных — нулевые (i≠j:aij=0){displaystyle (ineq j:a_{ij}=0)}

 , иногда записывается как:

diag(a1,a2,…,an).{displaystyle mathrm {diag} (a_{1},a_{2},dots ,a_{n}).} 

Единичная матрица

Единичная матрица — матрица, при умножении на которую любая матрица (или вектор) остается неизменной, является диагональной матрицей с единичными (всеми) диагональными элементами:

diag(1,1,…,1).{displaystyle mathrm {diag} (1,1,dots ,1).} 

Для её обозначения чаще всего используется обозначение I или E, а также просто 1 (или 1 специальным шрифтом).

Для обозначения её элементов также используется символ Кронекера δij{displaystyle delta _{ij}}

 , определяемый как:

δii=1{displaystyle delta _{ii}=1} 
δij=0{displaystyle delta _{ij}=0}  при i≠j.{displaystyle ineq j.} 

Нулевая матрица

Для обозначения нулевой матрицы — матрицы, все элементы которой нули (при сложении её с любой матрицей та остается неизменной, а при умножении на любую получается нулевая матрица) — используется обычно просто 0 или 0 специальным шрифтом, или буква, начертанием похожая на ноль, например Θ{displaystyle Theta }

 .

Операции над матрицами

Сложение матриц

Складывать можно только матрицы одинакового размера.

Сложение матриц A+B{displaystyle A+B}

  есть операция нахождения матрицы C{displaystyle C} , все элементы которой равны попарной сумме всех соответствующих элементов матриц A{displaystyle A}  и B{displaystyle B} , то есть каждый элемент матрицы C{displaystyle C}  равен

 cij=aij+bij{displaystyle c_{ij}=a_{ij}+b_{ij}} 

Свойства сложения матриц:

Все свойства линейных операций повторяют аксиомы линейного пространства и поэтому справедлива теорема:

Множество всех матриц одинаковых размеров mxn с элементами из поля P (поля всех действительных или комплексных чисел) образует линейное пространство над полем P (каждая такая матрица является вектором этого пространства). Впрочем, прежде всего во избежание терминологической путаницы, матрицы в обычных контекстах избегают без необходимости (которой нет в наиболее обычных стандартных применениях) и четкого уточнения употребления термина называть векторами.

Умножение матрицы на число

Умножение матрицы A{displaystyle A}

  на число λ∈K{displaystyle lambda in {mathcal {K}}}  заключается в построении матрицы λA=(λaij){displaystyle lambda A=(lambda a_{ij})} .

Свойства умножения матриц на число:

  • умножение на единицу: 1A = A;
  • ассоциативность: (λβ)A = λ(βA);
  • дистрибутивность: (λ+β)A = λA + βA;
  • дистрибутивность: λ(A+B) = λA + λB;

Умножение матриц

Matrix multiplication diagram.svg 

Умножение матриц (обозначение: AB{displaystyle AB}

 , реже со знаком умножения A×B{displaystyle Atimes B} ) — есть операция вычисления матрицы C{displaystyle C} , каждый элемент которой равен сумме произведений элементов в соответствующей строке первого множителя и столбце второго.

cij=∑k=1naikbkj{displaystyle c_{ij}=sum _{k=1}^{n}a_{ik}b_{kj}} 

Количество столбцов в матрице A{displaystyle A}

  должно совпадать с количеством строк в матрице B{displaystyle B} , иными словами, матрица A{displaystyle A}  обязана быть согласованной с матрицей B{displaystyle B} . Если матрица A{displaystyle A}  имеет размерность m×n{displaystyle mtimes n} , B{displaystyle B}  — n×k{displaystyle ntimes k} , то размерность их произведения AB=C{displaystyle AB=C}  есть m×k{displaystyle mtimes k} .

Свойства умножения матриц:

  • ассоциативность: (AB)C = A(BC);
  • некоммутативность (в общем случае): AB ≠{displaystyle neq }  BA;
  • произведение коммутативно в случае умножения с единичной матрицей: AI = IA;
  • дистрибутивность: (A+B)C = AC + BC, A(B+C) = AB + AC;
  • ассоциативность и коммутативность относительно умножения на число: (λA)B = λ(AB) = A(λB);

Умножение вектора на матрицу

По обычным правилам матричного умножения осуществляется умножение на матрицу слева вектора-столбца, а также умножение вектора-строки на матрицу справа. Поскольку элементы вектора-столбца или вектора-строки можно записать (что обычно и делается), используя один, а не два индекса, это умножение можно записать так:

для вектора-столбца v (получая новый вектор-столбец Av):

(Av)i=∑k=1naikvk,{displaystyle (Av)_{i}=sum _{k=1}^{n}a_{ik}v_{k},} 

для вектора-строки s (получая новый вектор-строку sA):

(sA)i=∑k=1nskaki.{displaystyle (sA)_{i}=sum _{k=1}^{n}s_{k}a_{ki}.} 

Вектор-строка, матрица и вектор-столбец могут быть умножены друг на друга, давая число (скаляр):

sAv=∑k,iskakivi.{displaystyle sAv=sum limits _{k,i}s_{k}a_{ki}v_{i}.} 

(Порядок важен: вектор-строка слева, вектор-столбец справа от матрицы).

Эти операции являются основой матричного представления линейных операторов и линейных преобразований координат (смены базисов), таких, как повороты, масштабирования, зеркальные отражения, а также (последнее) матричного представления билинейных (квадратичных) форм.

  • При представлении вектора вещественного векторного пространства в ортонормированном базисе (что эквивалентно использованию прямоугольных декартовых координат) соответствующие ему вектор-столбец и вектор-строка, представляющие собой набор компонент вектора, будут совпадать (поэлементно), отличаясь лишь формально своим изображением для корректности матричных операций (то есть один получается из другого просто операцией транспонирования). При использовании же неортонормированных базисов (например, косоугольных координат или хотя бы разных масштабов по осям) вектор-столбец соответствует компонентам вектора в основном базисе, а вектор-строка — в базисе, дуальном основному[5] (Иногда о пространстве векторов-строк говорят также как об особом, дуальном пространству векторов-столбцов, пространстве ковекторов).

Заметим, что обычной мотивировкой введения матриц и определения операции матричного умножения (см.тж.в статье об умножении матриц) является именно введение их, начиная с умножения вектора на матрицу (которое вводится исходя из преобразований базиса или вообще линейных операций над векторами), а уже затем композиции преобразований сопоставляется произведение матриц. Действительно, если новый вектор Av, полученный из исходного вектора v преобразованием, представимым умножением на матрицу A, преобразовать теперь ещё раз, преобразованием, представимым умножением на матрицу B, получив B(Av), то, исходя из правила умножения вектора на матрицу, приведенного в начале этого параграфа (используя ассоциативность умножения чисел и меняя порядок суммирования), нетрудно увидеть в результате формулу, дающую элементы матрицы (BA), представляющую композицию первого и второго преобразований и совпадающую с обычным определением матричного умножения.

Комплексное сопряжение

Если элементами матрицы A=(aij){displaystyle A=(a_{ij})}

  являются комплексные числа, то комплексно сопряжённая (не путать с эрмитово сопряжённой! см. далее) матрица равна A¯=(a¯i,j){displaystyle {bar {A}}=({bar {a}}_{i,j})} . Здесь a¯{displaystyle {bar {a}}}  — число, комплексно сопряжённое к a{displaystyle a} .

Транспонирование и эрмитово сопряжение

Транспонирование уже обсуждалось выше: если A=(aij){displaystyle A=(a_{ij})}

 , то AT=(aji){displaystyle A^{T}=(a_{ji})} . Для комплексных матриц более употребительно эрмитово сопряжение: A∗=A¯T{displaystyle A^{*}={bar {A}}^{T}} . С точки зрения операторного взгляда на матрицы, транспонированная и эрмитово сопряжённая матрица — это матрицы оператора, сопряжённого относительно скалярного или эрмитова произведения, соответственно.

След

Основная статья: След матрицы

Для квадратной матрицы A{displaystyle A}

  сумма диагональных элементов (т.е. главных миноров первого порядка) называется следом:

TrA=∑iaii=a11+…+ann{displaystyle mathrm {Tr} A=sum limits _{i}a_{ii}=a_{11}+ldots +a_{nn}} 

(другие обозначения Trace{displaystyle mathrm {Trace} }

 , Sp{displaystyle mathrm {Sp} } , Spur{displaystyle mathrm {Spur} } ).

Свойства:

  1. Если определены AB{displaystyle AB}  и BA{displaystyle BA} , то Tr(AB)=Tr(BA){displaystyle mathrm {Tr} (AB)=mathrm {Tr} (BA)} .
  2. След является инвариантом преобразований подобия матрицы, т.е. если S{displaystyle S}  невырождена, то TrA=Tr(S−1AS){displaystyle mathrm {Tr} A=mathrm {Tr} (S^{-1}AS)} .
  3. След равен сумме (всех, с учётом кратности) собственных значений матрицы: TrA=∑iλi=λ1+…+λn{displaystyle mathrm {Tr} A=sum limits _{i}lambda _{i}=lambda _{1}+ldots +lambda _{n}} . Более того, для любого целого (положительного) числа k{displaystyle k}  выполняется Tr(Ak)=∑iλik=λ1k+…+λnk{displaystyle mathrm {Tr} (A^{k})=sum limits _{i}lambda _{i}^{k}=lambda _{1}^{k}+ldots +lambda _{n}^{k}} .

Определитель (детерминант)

Основная статья: Определитель

Пусть матрица A{displaystyle A}

  — квадратная, тогда обозначение определителя: Δ=detA{displaystyle Delta =det A} . Если матрица 2×2{displaystyle 2times 2} , то Δ=detA=a11a22−a12a21{displaystyle Delta =det A=a_{11}a_{22}-a_{12}a_{21}} 

Перманент

Основная статья: Перманент

Связанные понятия

Линейные комбинации

В векторном пространстве линейной комбинацией векторов x1,…,xn{displaystyle mathbf {x} _{1},dots ,mathbf {x} _{n}}

  называется вектор

x=a1x1+⋯+anxn,{displaystyle mathbf {x} =a_{1}mathbf {x} _{1}+dots +a_{n}mathbf {x} _{n},} 

где a1,…,an{displaystyle a_{1},dots ,a_{n}}

  — коэффициенты разложения:

  • если все коэффициенты равны нулю, то такая комбинация называется тривиальной,
  • если же хотя бы один коэффициент отличен от нуля, то такая комбинация называется нетривиальной.

Это позволяет описать произведение C=AB{displaystyle C=AB}

  матриц A{displaystyle A}  и B{displaystyle B}  терминах линейных комбинаций:

  • столбцы матрицы C{displaystyle C}  — это линейные комбинации столбцов матрицы A{displaystyle A}  с коэффициентами, взятыми из матрицы B{displaystyle B} ;
  • строки матрицы C{displaystyle C}  — это линейные комбинации строк матрицы B{displaystyle B}  с коэффициентами, взятыми из матрицы A{displaystyle A} .

Линейная зависимость

Если какой-либо вектор можно представить в виде линейной комбинации, то говорят о линейной зависимости данного вектора от элементов комбинации.

Точнее, говорят так: некоторая совокупность элементов векторного пространства называется линейно зависимой, если существует равная нулю линейная комбинация элементов данной совокупности или

0=a1x1+⋯+anxn,{displaystyle mathbf {0} =a_{1}mathbf {x_{1}} +dots +a_{n}mathbf {x_{n}} ,} 

где не все числа a1,…,an{displaystyle a_{1},dots ,a_{n}}

  равны нулю; если такой нетривиальной комбинации не существует, то данная совокупность векторов называется линейно независимой.

Линейная зависимость векторов означает, что какой-то вектор заданной совокупности линейно выражается через остальные векторы.

Каждая матрица представляет собой совокупность векторов (одного и того же пространства). Две такие матрицы — две совокупности. Если каждый вектор одной совокупности линейно выражается через векторы другой совокупности, то на языке теории матриц этот факт описывается при помощи произведения матриц:

  • если строки матрицы C{displaystyle C}  линейно зависят от строк матрицы B{displaystyle B} , то C=AB{displaystyle C=AB}  для некоторой матрицы A{displaystyle A} ;
  • если столбцы матрицы C{displaystyle C}  линейно зависят от столбцов другой матрицы A{displaystyle A} , то C=AB{displaystyle C=AB}  для некоторой матрицы B{displaystyle B} .

Свойства

Матричные операции

Сложение и вычитание допускается только для матриц одинакового размера.

Существует нулевая матрица Θ{displaystyle Theta }

  такая, что её прибавление к другой матрице A не изменяет A, то есть

A+Θ=A{displaystyle A+Theta =A} 

Все элементы нулевой матрицы равны нулю.

Возводить в степень можно только квадратные матрицы.

  • Ассоциативность сложения: A+(B+C)=(A+B)+C.{displaystyle A+(B+C)=(A+B)+C.} 
  • Коммутативность сложения: A+B=B+A.{displaystyle A+B=B+A.} 
  • Ассоциативность умножения: A(BC)=(AB)C.{displaystyle A(BC)=(AB)C.} 
  • Вообще говоря, умножение матриц некоммутативно: AB≠BA{displaystyle ABneq BA} . Используя это свойство, вводят коммутатор матриц.
  • Дистрибутивность умножения относительно сложения:
    A(B+C)=AB+AC;{displaystyle A(B+C)=AB+AC;} 
    (B+C)A=BA+CA.{displaystyle (B+C)A=BA+CA.} 
  • С учётом упомянутых выше свойств, матрицы образуют кольцо относительно операций сложения и умножения.
  • Свойства операции транспонирования матриц:
    (AT)T=A{displaystyle (A^{T})^{T}=A} 
    (AB)T=BTAT{displaystyle (AB)^{T}=B^{T}A^{T}} 
    (A−1)T=(AT)−1{displaystyle (A^{-1})^{T}=(A^{T})^{-1}} , если обратная матрица A−1{displaystyle A^{-1}}  существует.
    (A+B)T=AT+BT{displaystyle (A+B)^{T}=A^{T}+B^{T}} 
    detA=detAT{displaystyle {text{det}};A={text{det}};A^{T}} 

Примеры

Основная статья: Список матриц

Квадратная матрица и смежные определения

Если количество строк матрицы равно количеству столбцов, то такая матрица называется квадратной.

Для квадратных матриц существует единичная матрица E{displaystyle E}

  (аналог единицы для операции умножения чисел) такая, что умножение любой матрицы на неё не влияет на результат, а именно

EA=AE=A{displaystyle EA=AE=A} 

У единичной матрицы единицы стоят только по главной диагонали, остальные элементы равны нулю

E=(10⋯001⋯0⋮⋮⋱⋮00⋯1){displaystyle E={begin{pmatrix}1&0&cdots &0&1&cdots &0vdots &vdots &ddots &vdots &0&cdots &1end{pmatrix}}} 

Для некоторых квадратных матриц можно найти так называемую обратную матрицу. Обратная матрица A−1{displaystyle A^{-1}}

  такова, что если матрицу умножить на обратную ей матрицу, то получится единичная матрица:

AA−1=E{displaystyle AA^{-1}=E} 

Обратная матрица существует не всегда. Матрицы, для которых обратная матрица существует, называются невырожденными (или регулярными), а для которых нет — вырожденными (или сингулярными). Матрица невырождена, если все её строки (столбцы) линейно независимы как векторы. Максимальное число линейно независимых строк (столбцов) называется рангом матрицы. Определителем (детерминантом) матрицы называется значение нормированной кососимметрической (антисимметрической) полилинейной формы валентности (p;0){displaystyle (p;;0)}

  на столбцах матрицы. Квадратная матрица над числовым полем вырождена тогда и только тогда, когда её определитель равен нулю.

Кольцо матриц

Из указанных выше свойств сложения и умножения матриц (ассоциативность и коммутативность сложения, дистрибутивность умножения, существование нулевой и противоположной по сложению матрицы) следует, что квадратные матрицы n на n с элементами из любого кольца R образуют кольцо, изоморфное кольцу эндоморфизмов свободного модуля Rn. Это кольцо обозначается M(n,R){displaystyle M(n,R)}

  или Mn(R){displaystyle M_{n}(R)} . Если же R — коммутативное кольцо, M(n,R){displaystyle M(n,R)}  является также ассоциативной алгеброй над R. Определитель матрицы с элементами из коммутативного кольца можно вычислять по обычной формуле, при этом матрица будет обратима тогда и только тогда, когда её определитель обратим в R. Это обобщает ситуацию с матрицами с элементами из поля, так как в поле обратим любой элемент, кроме нуля.

Матрицы в теории групп

Матрицы играют важную роль в теории групп. Они используются при построении общих линейных групп, специальных линейных групп, диагональных групп, треугольных групп, унитреугольных групп.

Конечную группу (в частности, симметрическую) можно (изоморфно) промоделировать матрицами перестановок (содержащими только «0» и «1»),

например, для S3{displaystyle S_{3}}

  : (100010001){displaystyle {begin{pmatrix}1&0&0&1&0&0&1end{pmatrix}}}  , (010001100){displaystyle {begin{pmatrix}0&1&0&0&11&0&0end{pmatrix}}}  , (001100010){displaystyle {begin{pmatrix}0&0&11&0&0&1&0end{pmatrix}}}  , (010100001){displaystyle {begin{pmatrix}0&1&01&0&0&0&1end{pmatrix}}}  , (001010100){displaystyle {begin{pmatrix}0&0&1&1&01&0&0end{pmatrix}}}  , (100001010){displaystyle {begin{pmatrix}1&0&0&0&1&1&0end{pmatrix}}}  .

Поле C{displaystyle mathbb {C} }

 комплексных чисел может быть (изоморфно) промоделированонад полем R{displaystyle mathbb {R} } вещественных чисел:

для z=x+iy,c=a+ib∈C{displaystyle z=x+iy,quad c=a+ibin mathbb {C} }

  матричные аналоги Z=(xy−yx){displaystyle Z={begin{pmatrix}x&y-y&xend{pmatrix}}}  , C=(ab−ba){displaystyle C={begin{pmatrix}a&b-b&aend{pmatrix}}}  , где x,y,a,b∈R{displaystyle x,y,a,bin mathbb {R} }  ;

z+c=(x+a)+i(y+b){displaystyle z+c=(x+a)+i(y+b)}

  соответствует Z+C=(x+ay+b−y−bx+a){displaystyle Z+C={begin{pmatrix}x+a&y+b-y-b&x+aend{pmatrix}}}  ;

zc=(xa−yb)+i(xb+ya){displaystyle zc=(xa-yb)+i(xb+ya)}

  соответствует ZC=(xa−ybxb+ya−ya−xb−yb+xa){displaystyle ZC={begin{pmatrix}xa-yb&xb+ya-ya-xb&-yb+xaend{pmatrix}}}  ;

z¯=x−iy{displaystyle {bar {z}}=x-iy}

  соответствует ZT=(x−yyx){displaystyle Z^{T}={begin{pmatrix}x&-yy&xend{pmatrix}}}  ;

|z|2=zz¯=x2+y2=det(Z)∈R{displaystyle |z|^{2}=z{bar {z}}=x^{2}+y^{2}=det(Z)in mathbb {R} }

  ;

1z=z¯zz¯=x−iyx2+y2{displaystyle {frac {1}{z}}={frac {bar {z}}{z{bar {z}}}}={frac {x-iy}{x^{2}+y^{2}}}}

  при z≠0{displaystyle zneq 0}  соответствует Z−1=ZTdet(Z){displaystyle Z^{-1}={frac {Z^{T}}{det(Z)}}}  при det(Z)≠0{displaystyle det(Z)neq 0}  ;

ez=ex+iy=ex(cos(y)+isin(y)){displaystyle e^{z}=e^{x+iy}=e^{x}(cos(y)+i,sin(y))}

  соответствует ex(cos(y)sin(y)−sin(y)cos(y)){displaystyle e^{x}{begin{pmatrix}cos(y)&sin(y)-sin(y)&cos(y)end{pmatrix}}}  .

В частности, для E=(1001){displaystyle E={begin{pmatrix}1&0&1end{pmatrix}}}

  , I=(01−10){displaystyle I={begin{pmatrix}0&1-1&0end{pmatrix}}} 

z=x+iy∈C{displaystyle z=x+iyin mathbb {C} }

  соответствует Z=xE+yI{displaystyle Z=xE+yI}  ,

где I2=−E{displaystyle I^{2}=-E}

  .

Замечание. Модель имеет автоморфизм (I→−I){displaystyle (Ito -I)}

 , то есть Z→ZT{displaystyle Zto Z^{T}} 

Тело кватернионов H{displaystyle mathbb {H} }

 может быть (изоморфно) промоделированонад полем R{displaystyle mathbb {R} } вещественных чисел:

для q=t+ix+jy+kz∈H{displaystyle q=t+ix+jy+kzin mathbb {H} }

  матричный аналог Q=(txy−z−xt−z−y−yztxzy−xt){displaystyle Q={begin{pmatrix}t&x&y&-z-x&t&-z&-y-y&z&t&xz&y&-x&tend{pmatrix}}}  , где t,x,y,z∈R{displaystyle t,x,y,zin mathbb {R} }  .

Для того, чтобы кватерниону q=t+ix+jy+kz{displaystyle q=t+ix+jy+kz}

 соответствовала матрица Q=tE+xI+yJ+zK{displaystyle Q=tE+xI+yJ+zK}  ,

где I2=J2=K2=−E{displaystyle I^{2}=J^{2}=K^{2}=-E}

  , IJ=−JI=K{displaystyle IJ=-JI=K}  , JK=−KJ=I{displaystyle JK=-KJ=I}  , KI=−IK=J{displaystyle KI=-IK=J}  ,

можно ввести базисные элементы

E=(1000010000100001){displaystyle E={begin{pmatrix}1&0&0&0&1&0&0&0&1&0&0&0&1end{pmatrix}}}

  , I=(0a00−a000000b00−b0){displaystyle I={begin{pmatrix}0&a&0&0-a&0&0&0&0&0&b&0&-b&0end{pmatrix}}}  , J=(00c0000d−c0000−d00){displaystyle J={begin{pmatrix}0&0&c&0&0&0&d-c&0&0&0&-d&0&0end{pmatrix}}}  , K=(000ad00−ac00−bd00bc000){displaystyle K={begin{pmatrix}0&0&0&ad&0&-ac&0&-bd&0&0bc&0&0&0end{pmatrix}}}  .

Параметры должны удовлетворять условиям:a,b,c,d∈{−1,+1}{displaystyle a,b,c,din left{-1,+1right}}

  и abcd=−1{displaystyle abcd=-1}  .

Существует 8 решений (8 представлений).

См. также

Примечания

  1. Под треугольными матрицами сейчас понимают матрицы, ненулевые элементы которых заполняют в таблице матрицы треугольную область, остальные же элементы — нули.
  2. Этот изоморфизм полностью задается выбором базиса в линейном пространстве: при фиксированном базисе изоморфизм фиксирован и таким образом реализована взаимная однозначность соответствия матриц операторам. Это не означает того, что такой изоморфизм в принципе единственный: в другом базисе тем же линейным операторам будут соответствовать другие матрицы (тоже взаимно однозначно при фиксации этого нового базиса).
  3. Березкина Э. И. Математика древнего Китая / Отв. ред. Б.А.Розенфельд. — М.: Наука, 1980. — С. 173-206. — 312 с.
  4. Даан-Дальмедико А., Пейффер Ж. Пути и лабиринты. Очерки по истории математики: Пер. с франц. — М.: Мир, 1986. — С. 397.
  5. Формально в этом определении всё симметрично, и можно было бы поменять «основной» и дуальный базис местами (они оба просто взаимно дуальны), однако принято именно описанное соглашение.

Литература

  • Беллман Р. Введение в теорию матриц. — М.: Мир, 1969 (djvu).
  • Биркгоф Г. (Garrett Birkhoff), Барти Т. (Thomas C. Bartee) Современная прикладная алгебра. — М.: Мир, 1976. — 400 с.
  • Ван дер Варден Б. Л. (B. L. van der Waerden) Алгебра. (2-е изд.) — М.: Наука, 1979. — 624 с.
  • Гантмахер Ф. Р. Теория матриц. — 5-е изд. — М.: Физматлит, 2004. — 560 с. — ISBN 5-9221-0524-8.; (2-е изд.). — М.: Наука, 1966 (djvu).
  • Голуб Дж. (Gene H. Golub), Ван Лоун Ч. (Charles F. Van Loan) Матричные вычисления. — М.: Мир, 1999. — 548 с. — ISBN 5-03-002406-9
  • Курош А. Г. Курс высшей алгебры. — 9-е изд. — М.: Наука, 1968. — 432 с.
  • Курош А. Г. Лекции по общей алгебре. — 2-е изд. — М.: Наука, 1973. — 400 с.
  • Ланкастер П. (P. Lankaster) Теория матриц / Пер. с англ. — 2-е изд. — М.: Наука, 1982. — 272 с.; 1-е изд. — М.: Наука, 1973 (djvu).
  • Ленг С. (Serge Lang) Алгебра. — М.: Мир, 1968. — 564 с.
  • Наймарк М. А. Теория представлений групп. — М.: Наука, 1976. — 560 с.
  • Соколов Н. П. Пространственные матрицы и их приложения. — М.: ГИФМЛ, 1960 (djvu).
  • Хорн Р. (Roger A. Horn), Джонсон Ч. (Charles C. Johnson) Матричный анализ. — М.: Мир, 1989. — 655 с. — ISBN 5-03-001042-4
  • Халмош П. Конечномерные векторные пространства = Finite-dimensional vector spaces. — М.: Физматгиз, 1963. — 264 с.