Sistemes d’equacions
En aquest capítol estudiem les propietats bàsiques dels sistemes d’equacions sobre un cos.
Definició 1 (Sistema d’equacions) Donats \(m,n\in\mathbb{N}\), un sistema \(\mathcal{S}\) d’\(m\) equacions amb \(n\) incògnites sobre un cos \(\mathbb{K}\) és un conjunt d’\(m\) equacions del tipus
\[ \left. \begin{array}{ccccccccc} \alpha_{11}x_{1} &+ &\alpha_{12}x_{2} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \alpha_{21}x_{1} &+ &\alpha_{22}x_{2} &+ &\cdots &+ &\alpha_{2n}x_{n} &= &\beta_{2}\\ \vdots & &\vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\alpha_{m2}x_{2} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \tag{$\mathcal{S}$} \]
on, els elements \(\alpha_{ij}\), amb \(1\leq i\leq m\) i \(1\leq j\leq n\), s’anomenen coeficients del sistema i pertanyen a \(\mathbb{K}\), els elements \(\beta_{i}\), amb \(1\leq i\leq m\), s’anomenen termes independents del sistema i pertanyen a \(\mathbb{K}\) i els elements \(x_{j}\), amb \(1\leq j\leq n\), són variables desconegudes anomenades incògnites.
Direm que el sistema \(\mathcal{S}\) és homogeni, si tots els termes independents són igual a \(0\).
Direm que els sistemes \(\mathcal{S}\) i \(\mathcal{T}\) són iguals si tenen el mateix nombre d’equacions i d’incògnites i, a més, per a cada parella d’índexs \(i,j\), els coeficients en la posició \((i,j)\) coincideixen i, per a cada índex \(i\), amb \(1\leq i\leq n\), els termes independents en la posició \(i\) coincideixen.
Direm que el sistema d’equacions \(\mathcal{S}\) té solució si existeix una tupla \((a_{1}, \cdots, a_{n})\in\mathbb{K}^{n}\) tal que, en substituïr, per a cada \(j\), amb \(1\leq j\leq n\), les incògnites \(x_{j}\) pels elements \(a_{j}\), se satisfan les \(m\) equacions del sistema. Denotem per \(\mathrm{Sol}(\mathcal{S})\) al conjunt de totes les solucions del sistema \(\mathcal{S}\), és a dir, \[\mathrm{Sol}(\mathcal{S})=\left\lbrace (a_{1},\cdots, a_{n})\in \mathbb{K}^{n} \quad\middle|\quad \begin{array}{ccccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace . \]
Exemple 1 Es considera el següent sistema, a esquerra, de \(3\) equacions amb \(3\) incògnites sobre \(\mathbb{Q}\). Aquest sistema admet a \((1,3,1)\) com a solució, ja que se satisfan les següents \(3\) equacions, a dreta. \[ \left. \begin{array}{ccccccc} 2x &+ &2y &+ &10z &= &18\\ 2x &+ &3y &+ &12z &= &23\\ & &2y &+ &5z &= &11\\ \end{array} \right\rbrace \qquad\qquad\qquad \left. \begin{array}{ccccccc} 2 &+ &6 &+ &10 &= &18\\ 2 &+ &9 &+ &12 &= &23\\ & &6 &+ &5 &= &11\\ \end{array} \right\rbrace \]
Definició 2 ((In)Compatible | (In)Determinat) Un sistema d’equacions pot tindre solució o no tindre’n. En cas d’existir solució, anomenarem al sistema , en cas de no tindre’n, l’anomenarem . S’usaran les següents abreviatures
- [SC] Sistema Compatible;
- [SI] Sistema Incompatible.
Donat un sistema compatible, la solució del sistema pot ser única o no. En cas de tindre unicitat en la solució anomenarem al sistema , en cas de no tindre unicitat en la solució l’anomenarem . S’usaran les següents abreviatures
- [SCD] Sistema Compatible Determinat;
- [SCI] Sistema Compatible Indeterminat.
Exemple 2 Es consideren els següents sistemes d’una equació amb una incògnita sobre \(\mathbb{R}\) \[ (\mathcal{S}_{1})\quad \left. \begin{array}{ccc} 0x &= &1\\ \end{array} \right\rbrace \qquad\qquad (\mathcal{S}_{2})\quad \left. \begin{array}{ccc} x &= &1\\ \end{array} \right\rbrace \qquad\qquad (\mathcal{S}_{3})\quad \left. \begin{array}{ccc} 0x &= &0\\ \end{array} \right\rbrace \]
El sistema \((\mathcal{S}_{1})\) és incompatible, el sistema \((\mathcal{S}_{2})\) és compatible determinat, amb única solució \(x=1\), i el sistema \((\mathcal{S}_{3})\) és compatible indeterminat, ja que admet a qualsevol element \(a\in\mathbb{R}\) com a solució.
Definició 3 (Sistemes equivalents) Siguen \(\mathcal{S}\) i \(\mathcal{T}\) dos sistemes d’\(m\) equacions i \(n\) incògnites sobre \(\mathbb{K}\). Direm que \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents si \(\mathrm{Sol}(\mathcal{S})=\mathrm{Sol}(\mathcal{T})\). És a dir, \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents si tenen les mateixes solucions.
Observació. Tot sistema d’equacions té les mateixes solucions que ell mateix. Si un sistema d’equacions té les mateixes solucions que un altre, aquest altre té les mateixes solucions que l’original. Si un sistema d’equacions té les mateixes solucions que un altre i aquest altre té les mateixes solucions que un tercer, el primer sistema i el tercer tenen les mateixes solucions.
1 Operacions elementals
Hi han transformacions de sistemes d’equacions que ens permeten garantir que el sistema d’equacions resultant siga equivalent a l’original. Aquestes transformacions reben el nom d’operacions elementals. Les enumerem a continuació i demostrem que el sistema transformat és equivalent a l’original.
1.1 Intercanviar files
Donat un sistema \(\mathcal{S}\) d’\(m\) equacions amb \(n\) incògnites i donats dos índexs \(i,j\), amb \(1\leq i,j\leq m\), denotem per \(\mathcal{S}_{i\leftrightarrow j}\) el sistema que resulta d’intercanviar les files \(i\) i \(j\) en \(\mathcal{S}\). Indiquem aquesta operació amb una fletxa on es descriga el canvi de files. \[ \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}x_{1} &+ &\cdots &+ &\alpha_{in}x_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}x_{1} &+ &\cdots &+ &\alpha_{jn}x_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \xrightarrow[\qquad\qquad]{f_{i}\leftrightarrow f_{j}} \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}x_{1} &+ &\cdots &+ &\alpha_{jn}x_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}x_{1} &+ &\cdots &+ &\alpha_{in}x_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \]
Proposició 1 Els sistemes d’equacions \(\mathcal{S}\) i \(\mathcal{S}_{i\leftrightarrow j}\) són equivalents.
Demostració. Siga \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) una solució del sistema \(\mathcal{S}\). Així, en fer les substitucions pertinents, trobem que les següents \(m\) eqüacions, a esquerra, són certes. Com que aquestes \(m\) eqüacions són certes, les \(m\) següents equacions, a dreta, que resulten d’intercanviar l’equació \(i\) per la \(j\), també són certes \[ \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}a_{1} &+ &\cdots &+ &\alpha_{in}a_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}a_{1} &+ &\cdots &+ &\alpha_{jn}a_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \qquad \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}a_{1} &+ &\cdots &+ &\alpha_{jn}a_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}a_{1} &+ &\cdots &+ &\alpha_{in}a_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \] Així, \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) és una solució del sistema \(\mathcal{S}_{i\leftrightarrow j}\).
D’altra banda, si considerem una solució del sistema \(\mathcal{S}_{i\leftrightarrow j}\), pel que acabem de vore, aquesta solució també ho serà del sistema \((\mathcal{S}_{i\leftrightarrow j})_{i\leftrightarrow j}\). Notem que aquest últim sistema és el sistema original.
1.2 Multiplicar una fila per un escalar no nul
Donat un sistema \(\mathcal{S}\) d’\(m\) equacions lineals amb \(n\) incògnites, donat un índex \(i\), amb \(1\leq i\leq m\), i un escalar \(\lambda\in\mathbb{K}-\{0\}\), denotem per \(\mathcal{S}_{\lambda i}\) el sistema que resulta de multiplicar la fila \(i\) per \(\lambda\) en \(\mathcal{S}\). Indiquem aquesta operació amb una fletxa on es descriga la multiplicació corresponent. \[ \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}x_{1} &+ &\cdots &+ &\alpha_{in}x_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \xrightarrow[\qquad\qquad]{f_{i}=\lambda f_{i}} \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \lambda\alpha_{i1}x_{1} &+ &\cdots &+ &\lambda\alpha_{in}x_{n} &= &\lambda\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \]
Proposició 2 Els sistemes d’equacions \(\mathcal{S}\) i \(\mathcal{S}_{\lambda i}\), amb \(\lambda\in \mathbb{K}-\{0\}\), són equivalents.
Demostració. Siga \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) una solució del sistema \(\mathcal{S}\). Així, en fer les substitucions pertinents, trobem que les següents \(m\) eqüacions a esquerra són certes. Com que aquestes \(m\) eqüacions són certes, les \(m\) següents equacions, a dreta, que resulten de multiplicar l’equació \(i\) per \(\lambda\), també són certes \[ \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}a_{1} &+ &\cdots &+ &\alpha_{in}a_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \qquad \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \lambda\alpha_{i1}a_{1} &+ &\cdots &+ &\lambda\alpha_{in}a_{n} &= &\lambda\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \] Així, \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) és una solució del sistema \(\mathcal{S}_{\lambda i}\).
D’altra banda, si considerem una solució del sistema \(\mathcal{S}_{\lambda i}\), pel que acabem de vore, aquesta solució també ho serà del sistema \((\mathcal{S}_{\lambda i})_{\lambda^{-1}i}\). Notem que aquest últim sistema és el sistema original. Açò ho hem pogut fer perquè \(\lambda\) és un escalar no nul i, per tant, podem considerar \(\lambda^{-1}\).
1.3 Sumar a una fila una altra multiplicada per un escalar
Donat un sistema \(\mathcal{S}\) d’\(m\) equacions amb \(n\) incògnites, donats dos índexs \(i,j\), amb \(1\leq i,j\leq m\), i donat un escalar \(\lambda\in\mathbb{K}\), denotem per \(\mathcal{S}_{i+\lambda j}\) el sistema que resulta de sumar a la fila \(i\) la fila \(j\) multiplicada per \(\lambda\) en \(\mathcal{S}\). Indiquem aquesta operació amb una fletxa on es descriga la suma corresponent. \[ \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}x_{1} &+ &\cdots &+ &\alpha_{in}x_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}x_{1} &+ &\cdots &+ &\alpha_{jn}x_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \xrightarrow[\qquad\qquad]{f_{i}=f_{i}+\lambda f_{j}} \qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad \] \[ \qquad\qquad\qquad\qquad\qquad\qquad\quad \left. \begin{array}{ccccccc} \alpha_{11}x_{1} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ (\alpha_{i1}+\lambda\alpha_{j1})x_{1} &+ &\cdots &+ &(\alpha_{in}+\lambda\alpha_{jn})x_{n} &= &\beta_{i}+\lambda\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}x_{1} &+ &\cdots &+ &\alpha_{jn}x_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \]
Proposició 3 Els sistemes d’equacions \(\mathcal{S}\) i \(\mathcal{S}_{i+\lambda j}\) són equivalents.
Demostració. Siga \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) una solució del sistema \(\mathcal{S}\). Així, en fer les substitucions pertinents, trobem que les següents \(m\) eqüacions, a esquerra, són certes. Com que aquestes \(m\) eqüacions són certes, les \(m\) següents equacions, a dreta, que resulten de sumar a l’equació \(i\) la \(j\) multiplicada per \(\lambda\), també són certes \[ \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{i1}a_{1} &+ &\cdots &+ &\alpha_{in}a_{n} &= &\beta_{i}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}a_{1} &+ &\cdots &+ &\alpha_{jn}a_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad \] \[ \qquad\qquad\qquad\qquad\qquad\qquad \left. \begin{array}{ccccccc} \alpha_{11}a_{1} &+ &\cdots &+ &\alpha_{1n}a_{n} &= &\beta_{1}\\ \vdots & &\ddots & &\vdots & &\vdots\\ (\alpha_{i1}+\lambda\alpha_{j1})a_{1} &+ &\cdots &+ &(\alpha_{in}+\lambda\alpha_{jn})a_{n} &= &\beta_{i}+\lambda\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{j1}a_{1} &+ &\cdots &+ &\alpha_{jn}a_{n} &= &\beta_{j}\\ \vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}a_{1} &+ &\cdots &+ &\alpha_{mn}a_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \] Així, \((a_{1},\cdots,a_{n})\in \mathbb{K}^{n}\) és una solució del sistema \(\mathcal{S}_{i + \lambda j}\).
D’altra banda, si considerem una solució del sistema \(\mathcal{S}_{i + \lambda j}\), pel que acabem de vore, aquesta solució també ho serà del sistema \((\mathcal{S}_{i + \lambda j})_{i - \lambda j}\). Notem que aquest últim sistema és el sistema original.
2 Mètode de Gauss-Jordan
En l’anterior secció hem descrit tres famílies d’operacions elementals sobre sistemes d’equacions que transformen un sistema donat en un altre d’equivalent. L’aplicació successiva d’aquestes transformacions garantitza que el sistema transformat final siga equivalent a l’original.
Definició 4 (Sistemes equivalents per files) Siguen \(\mathcal{S}\) i \(\mathcal{T}\) dos sistemes d’\(m\) equacions i \(n\) incògnites sobre \(\mathbb{K}\). Direm que \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents per files si existeix una seqüència finita de transformacions elementals per fila que transformen el sistema \(\mathcal{S}\) en el sistema \(\mathcal{T}\).
Observació. Tot sistema d’equacions és equivalent per files amb ell mateix. La seqüència de transformacions elementals per fila que ho verifica és la seqüència buida. No cal fer res. Si un sistema d’equacions és equivalent per files a un altre, aquest altre també és equivalent per files a l’original. Només cal notar, com hem vist a les demostracions anteriors, que les operacions elementals per fila sempre es poden desfer per a retornar al sistema original. Si un sistema d’equacions és equivalent per files a un altre i aquest altre és equivalent per files a un tercer, el primer sistema i el tercer són equivalents per files. Només cal concatenar les respectives seqüències de transformacions elementals per fila per a passar del primer al tercer.
La importància d’aquesta discussió es veu clarament en el següent exemple.
Exemple 3 Considerem el sistema de \(3\) equacions amb \(3\) incògnites sobre \(\mathbb{Q}\) considerat en l’Exemple 1. Es considera la següent seqüència d’operacions elementals \[ \begin{array}{rcrc} \left. \begin{array}{ccccccc} 2x &+ &2y &+ &10z &= &18\\ 2x &+ &3y &+ &12z &= &23\\ & &2y &+ &5z &= &11\\ \end{array} \right\rbrace & \overset{f_{1}=\frac{1}{2}f_{1}} \longrightarrow & \left. \begin{array}{ccccccc} x &+ &y &+ &5z &= &9\\ 2x &+ &3y &+ &12z &= &23\\ & &2y &+ &5z &= &11\\ \end{array} \right\rbrace\\ \\& \overset{f_{2}=f_{2}-2f_{1}} \longrightarrow & \left. \begin{array}{ccccccc} x &+ &y &+ &5z &= &9\\ & &y &+ &2z &= &5\\ & &2y &+ &5z &= &11\\ \end{array} \right\rbrace\\ \\& \overset{f_{3}=f_{3}-2f_{2}} \longrightarrow & \left. \begin{array}{ccccccc} x &+ &y &+ &5z &= &9\\ & &y &+ &2z &= &5\\ & & & &z &= &1\\ \end{array} \right\rbrace \end{array} \]
Notem que tots els sistemes d’equacions que apareixen en l’anterior seqüència són equivalents en virtut de les Proposicions 1, 2 i 3. La modificació feta té un objectiu últim, simplificar el sistema original. De fet en l’últim sistema ja podríem recuperar una solució per a la incògnita \(z\). Una solució del sistema original deurà satisfer l’equació \(z=1\).
Continuem amb el procés de simplificació des de l’últim sistema d’equacions. \[ \begin{array}{rcrc} \left. \begin{array}{ccccccc} x &+ &y &+ &5z &= &9\\ & &y &+ &2z &= &5\\ & & & &z &= &1\\ \end{array} \right\rbrace & \overset{f_{2}=f_{2}-2f_{3}} \longrightarrow & \left. \begin{array}{ccccccc} x &+ &y &+ &5z &= &9\\ & & & &y &= &3\\ & & & &z &= &1\\ \end{array} \right\rbrace \\ \\& \overset{f_{1}=f_{1}-f_{2}} \longrightarrow & \left. \begin{array}{ccccccc} & &x &+ &5z &= &6\\ & & & &y &= &3\\ & & & &z &= &1\\ \end{array} \right\rbrace \\ \\& \overset{f_{1}=f_{1}-5f_{3}} \longrightarrow & \left. \begin{array}{ccccccc} & & & &x &= &1\\ & & & &y &= &3\\ & & & &z &= &1\\ \end{array} \right\rbrace \end{array} \]
Aquest procediment de simplificació ens ha permés obtindre tres conseqüències interessants: (1) que el sistema original és equivalent a l’últim, ja que hem passat d’un a l’altre mitjançant l’aplicació d’una seqüència finita d’operacions elementals, (2) que l’últim sistema admet únicament a \((1,3,1)\) com a solució i (3) que aquesta solució és única, ja que no hi ha una altra assignació possible que faça l’últim sistema d’equacions cert. Es dedueix d’aquest procediment que el sistema original és compatible i determinat.
El que vorem en aquesta secció és que aquest procés de simplificació es pot donar en tot sistema d’equacions. Per a simplificar més encara el procediment el que farem serà representar els sistemes d’equacions mitjançant matrius. D’aquesta forma, evitarem repetir tota la informació supèrflua que arrosseguem en cada aplicació d’operacions elementals. Presentem a continuació una forma de representar tot sistema d’equacions mitjançant una matriu.
Definició 5 (Representació matricial) Donat el sistema d’\(m\) equacions amb \(n\) incògnites sobre un cos \(\mathbb{K}\) \[ \left. \begin{array}{ccccccccc} \alpha_{11}x_{1} &+ &\alpha_{12}x_{2} &+ &\cdots &+ &\alpha_{1n}x_{n} &= &\beta_{1}\\ \alpha_{21}x_{1} &+ &\alpha_{22}x_{2} &+ &\cdots &+ &\alpha_{2n}x_{n} &= &\beta_{2}\\ \vdots & &\vdots & &\ddots & &\vdots & &\vdots\\ \alpha_{m1}x_{1} &+ &\alpha_{m2}x_{2} &+ &\cdots &+ &\alpha_{mn}x_{n} &= &\beta_{m}\\ \end{array} \right\rbrace \tag{$\mathcal{S}$} \]
Anomenem representació matricial del sistema \(\mathcal{S}\) a l’expressió matricial següent \[ \begin{bmatrix} \alpha_{11} &\alpha_{12} &\cdots &\alpha_{1n} \\ \alpha_{21} &\alpha_{22} &\cdots &\alpha_{2n} \\ \vdots &\vdots &\ddots &\vdots \\ \alpha_{m1} &\alpha_{m2} &\cdots &\alpha_{mn} \\ \end{bmatrix} \begin{bmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{bmatrix} = \begin{bmatrix} \beta_{1} \\ \beta_{2} \\ \vdots \\ \beta_{n} \end{bmatrix}, \]
on \(\mathsf{A}=(\alpha_{ij})\) és la matriu de coeficients, de tamany \(m,n\), \(\mathsf{X}=(x_{j})\) és la matriu d’incògnites, de tamany \(n,1\), i \(\mathsf{B}=(\beta_{i})\) és la matriu de termes independents, de tamany \(m,1\). Així, un sistema d’equacions lineals pot escriure’s en forma matricial com a \(\mathsf{A}\mathsf{X}=\mathsf{B}\).
Definim la matriu ampliada del sistema \(\mathcal{S}\), denotada per \([\mathsf{A}| \mathsf{B}]\), a la següent matriu \[ [\mathsf{A}| \mathsf{B}] = \begin{bmatrix} \begin{array}{cccc|c} \alpha_{11} &\alpha_{12} &\cdots &\alpha_{1n} &\beta_{1} \\ \alpha_{21} &\alpha_{22} &\cdots &\alpha_{2n} &\beta_{2} \\ \vdots &\vdots &\ddots &\vdots &\vdots \\ \alpha_{m1} &\alpha_{m2} &\cdots &\alpha_{mn} &\beta_{m} \\ \end{array} \end{bmatrix} \]
La matriu ampliada té tamany \(m,n+1\). Notem que dos sistemes d’equacions lineals són iguals si i només si les respectives matrius ampliades són iguals.
La introducció de la matriu ampliada d’un sistema ens permet quedar-nos amb la informació més relevant del sistema. D’aquesta forma, tot sistema d’\(m\) equacions amb \(n\) incògnites pot representar-se mitjançant la seua matriu ampliada, és a dir, una matriu de tamany \(m,n+1\). D’igual manera, a partir d’una matriu de tamany \(m,n+1\) sempre podem recuperar un sistema d’\(m\) equacions amb \(n\) incògnites.
Aquesta codificació també ens permet parlar d’operacions elementals entre matrius com vorem en el següent exemple.
Exemple 4 Reescrivim la seqüència d’operacions elementals descrita en l’Exemple 3 utilitzant les corresponents matrius ampliades \[ \begin{array}{ccccc} \begin{bmatrix} \begin{array}{ccc|c} 2 &2 &10 &18\\ 2 &3 &12 &23\\ 0 &2 &5 &11\\ \end{array} \end{bmatrix} &\overset{f_{1}=\frac{1}{2}f_{1}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &1 &5 &9\\ 2 &3 &12 &23\\ 0 &2 &5 &11\\ \end{array} \end{bmatrix} &\overset{f_{2}=f_{2}-2f_{1}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &1 &5 &9\\ 0 &1 &2 &5\\ 0 &2 &5 &11\\ \end{array} \end{bmatrix}\\ \\ &\overset{f_{3}=f_{3}-2f_{2}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &1 &5 &9\\ 0 &1 &2 &5\\ 0 &0 &1 &1\\ \end{array} \end{bmatrix} &\overset{f_{2}=f_{2}-2f_{3}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &1 &5 &9\\ 0 &1 &0 &3\\ 0 &0 &1 &1\\ \end{array} \end{bmatrix}\\ \\ &\overset{f_{1}=f_{1}-2f_{2}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &0 &5 &6\\ 0 &1 &0 &3\\ 0 &0 &1 &1\\ \end{array} \end{bmatrix} &\overset{f_{1}=f_{1}-5f_{3}} \longrightarrow & \begin{bmatrix} \begin{array}{ccc|c} 1 &0 &0 &1\\ 0 &1 &0 &3\\ 0 &0 &1 &1\\ \end{array} \end{bmatrix} \end{array} \]
El fet de treballar amb matrius ens permet observar amb major claredat que el procés seguit ens ha permés passar d’una matriu qualsevol a una matriu de coeficients intermitja esglaonada, la quarta, i a una matriu de coeficients esglaonada reduïda, l’última.
Per extensió del que hem vist fins al moment, introduïm la relació d’equivalència per files sobre el conjunt de les matrius d’un tamany determinat.
Definició 6 (Matrius equivalents per fila) Direm que dues matrius en \(\mathrm{M}_{mn}(\mathbb{K})\) són equivalents per files si podem transformar una en l’altra mitjançant l’aplicació d’una seqüència finita d’operacions elementals per fila.
Observació. Ser equivalents per fila és una relació d’equivalència en \(\mathrm{M}_{mn}(\mathbb{K})\).
El procediment realitzat en l’Exemple 4 ens ha permés passar d’un sistema d’equacions a un sistema d’equacions que té com a matriu ampliada una matriu esglaonada reduïda. En la següent definició posem nom a aquesta propietat.
Definició 7 (Forma normal d’un sistema d’equacions) Donat un sistema lineal \(\mathcal{S}\) d’\(m\) equacions amb \(n\) incògnites, anomemen forma normal per files d’\(\mathcal{S}\) a tot sistema d’equacions \(\mathcal{U}\) equivalent a \(\mathcal{S}\) que tinga com a matriu ampliada una matriu esglaonada reduïda per files.
Direm que un sistema \(\mathcal{U}\) està en forma normal per files si la matriu ampliada d’\(\mathcal{U}\) és esglaonada reduïda per files. Si \(\mathcal{U}\) està en forma normal per files, direm que l’incògnita \(x_{j}\), per a un índex \(j\) amb \(1\leq j\leq n\), és principal si existeix algun índex \(i\), amb \(1\leq i\leq m\), de forma que l’entrada \(\alpha_{ij}\) de la matriu de coeficients és el pivot de la fila \(i\).
En les següents subseccions vorem com, donat un sistema d’equacions lineal, sempre podem trobar-li una forma normal per files i també demostrarem que aquesta forma normal per files és única.
2.1 Existència de forma normal
El següent algorisme ens garantitza que, donada una matriu qualsevol sempre podem transformar-la mitjançant l’aplicació d’una seqüència finita de transformacions elementals per fila en una matriu esglaonada reduïda per files. Açò ens permetrà garantir l’existència d’un procediment per obtindre formes normals per files de sistemes d’equacions lineals.
Proposició 4 (Mètode d’Eliminació de Gauss-Jordan) Siga \(\mathsf{A}\) una matriu en \(\mathrm{M}_{m,n}(\mathbb{K})\), aleshores existeix una seqüència finita d’operacions elementals per fila que transformen la matriu \(\mathsf{A}\) en una matriu esglaonada (reduïda) per files.
Demostració. Considerem la matriu \(\mathsf{A}=(\alpha_{ij})\). La demostració serà algorísmica.
Si la matriu \(\mathsf{A}\) és la matriu \(\mathsf{0}\), és a dir la matriu en què tota entrada és \(0\), aleshores aquesta matriu ja és esglaonada reduïda. Per tant podem suposar que existeixen índexs \(i,j\), amb \(1\leq i\leq m\) i \(1\leq j\leq n\), per als quals l’entrada \(\alpha_{ij}\) és un element no nul.
- Pas 1. Si hi ha un element no nul en la primera columna d’\(\mathsf{A}\) el portem a la posició \((1,1)\).
Pot ocòrrer que (1) la primera columna d’\(\mathsf{A}\) té un element no zero en la posició \(i\), amb \(1\leq i\leq m\); o (2) la primera columna d’\(\mathsf{A}\) és una columna de zeros.
En cas (1), intercanviem la fila \(1\) per la fila \(i\). D’aquesta manera garantim que l’element \(\alpha_{11}\) en la matriu transformada siga diferent de zero.
En cas (2), deixarem queta la primera columna i començarem des del Pas 1 amb la submatriu d’\(\mathsf{A}\) donada per \(\overline{\mathsf{A}}=(\alpha_{ij})\), amb \(1\leq i\leq m\) i \(1\leq j\leq n\). Aquesta etapa no pot repetir-se indefinidament, ja que només hi ha \(m\) columnes i tenim garantits des del primer moment l’existència d’un element \(\alpha_{ij}\) no nul en \(\mathsf{A}\).
En qualsevol cas, garantim l’objectiu del Pas 1, és a dir, mitjançant una seqüència finita d’operacions elementals per fila, portar un element no nul a la posició \((1,1)\). Aquest element és pivot per a la primera fila d’\(\mathsf{A}\).
- Pas 2. Transformem l’element no nul \(\alpha_{11}\) d’\(\mathsf{A}\) en un \(1\).
Com que l’element \(\alpha_{11}\) és no nul, existeix el seu invers en \(\mathbb{K}\). Aleshores podem multiplicar la primera fila d’\(\mathsf{A}\) per l’invers d’\(\alpha_{11}\).
Garantim així l’objectiu del Pas 2, és a dir, mitjançant una seqüència finita d’operacions elementals per fila, assegurar que l’element \(\alpha_{11}\) és un \(1\). Aquest element és pivot per a la primera fila d’\(\mathsf{A}\).
- Pas 3. Transformem tots els element de la primera columna d’\(\mathsf{A}\) per davall d’\(\alpha_{11}\) en \(0\).
Siga \(\alpha_{i1}\) amb \(1\leq i\leq m\) un element de la primera columna d’\(\mathsf{A}\) per davall d’\(\alpha_{11}\). Si l’element \(\alpha_{i1}\) és l’element \(0\), ja estaria, en cas contrari sumem a la fila \(i\) la fila \(1\) multiplicada per \(-\alpha_{i1}\).
Repetim fins completar tots els índexs \(i\), amb \(2\leq i\leq m\).
Garantim així l’objectiu del Pas 3, és a dir, mitjançant una seqüència finita d’operacions elementals per fila, assegurar que tots els element \(\alpha_{i1}\), amb \(2\leq i\leq m\), siguen \(0\). D’aquesta manera la primera columna de la matriu \(\mathsf{A}\) serà una columna amb un \(1\) en la posició \(1\) i un \(0\) en les posicions inferiors.
- Pas 4. Treballem en la submatriu que resulta de llevar la primera fila i la primera columna.
Considerem la submatriu d’\(\mathsf{A}\) donada per \(\overline{\mathsf{A}}=(\alpha_{ij})\), amb \(2\leq i\leq m\) i \(2\leq j\leq n\). Reiniciem l’algorisme amb aquesta nova matriu.
Aquest procediment no pot repetir-se indefinidament, ja que en cada passada reduïm el tamany de la submatriu i el nombre de files i columnes d’\(\mathsf{A}\) és finit. Garantim, per tant, la transformació de la matriu \(\mathsf{A}\) mitjançant una seqüència finita d’operacions elementals fila en una matriu esglaonada.
- Pas 5. Eliminem les entrades damunt dels pivots.
Per a completar la transformació d’una matriu esglaonada en una matriu esglaonada reduïda només caldrà, per a cada índex \(i\), amb \(1\leq i\leq m\), eliminar els elements no nuls per damunt del pivot de la fila \(i\). Per a fer-ho, sumarem a cada fila \(k\), per a \(1\leq k\leq i-1\), per damunt de la fila del pivot la fila \(i\) multiplicada per l’oposat de cada element \(\alpha_{ki}\).
Garantim, per tant, la transformació de la matriu esglaonada \(\mathsf{A}\) mitjançant una seqüència finita d’operacions elementals fila en una matriu esglaonada reduïda per files.
Corol·lari 1 Tot sistema d’equacions es pot transformar mitjançant l’aplicació d’una seqüència finita d’operacions elementals en un sistema equivalent que té com a matriu ampliada una matriu esglaonada reduïda. És a dir, tot sistema d’equacions és equivalent per files a un sistema d’equacions en forma normal. Igualment, tota matriu és equivalent per files a una matriu en forma esglaonada reduïda per files.
2.2 Unicitat de la forma normal
Notem que el mètode de Gauss-Jordan permet obtindre una forma normal d’un sistema d’equacions qualsevol. En tot cas, aquest procediment no té per què ser únic. Tampoc sabem encara si la forma normal d’un sistema ha de ser necessàriament única. Açò és el que demostrarem a continuació per a sistemes d’equacions compatibles. El següent lema ens diu que, donats dos sistemes d’equacions compatibles en forma normal, si aquests sistemes d’equacions són equivalents és perquè són el mateix sistema.
Lema 1 Siguen \(\mathcal{U}\) i \(\mathcal{V}\) dos sistemes compatibles d’\(m\) equacions amb \(n\) incògnites. Si \(\mathcal{U}\) i \(\mathcal{V}\) són equivalents i estan en forma normal, aleshores \(\mathcal{U}\) i \(\mathcal{V}\) són iguals.
Demostració. Siguen \([\mathsf{A}| \mathsf{B}]\) i \([\mathsf{C}| \mathsf{D}]\) les matrius ampliades de, respectivament, \(\mathcal{U}\) i \(\mathcal{V}\). Com que \(\mathcal{U}\) i \(\mathcal{V}\) estan en forma normal, es té que les matrius \(\mathsf{K}\) i \(\mathsf{L}\) són esglaonades reduïdes per fila. Per vore que \(\mathcal{U}\) i \(\mathcal{V}\) són el mateix sistema només cal comprovar que \([\mathsf{A}| \mathsf{B}]\) i \([\mathsf{C}| \mathsf{D}]\) són iguals. Notem que les matrius \([\mathsf{A}| \mathsf{B}]\) i \([\mathsf{C}| \mathsf{D}]\) tenen tamany \(m,n+1\).
Ho farem per inducció sobre \(n\), el nombre d’incògnites dels sistemes.
- Cas base. \(n=1\).
Si els dos sistemes estan en forma normal i tenen una única incògnita, les matrius ampliades necessàriament han de ser de la forma \[ [\mathsf{A}| \mathsf{B}]= \begin{bmatrix} \begin{array}{c|c} 1&\beta_{1}\\ 0&\beta_{2}\\ \vdots&\vdots\\ 0&\beta_{m} \end{array} \end{bmatrix} \qquad\qquad \qquad\qquad [\mathsf{C}| \mathsf{D}]= \begin{bmatrix} \begin{array}{c|c} 1&\delta_{1}\\ 0&\delta_{2}\\ \vdots&\vdots\\ 0&\delta_{m} \end{array} \end{bmatrix} \]
Notem que les últimes columnes de les dues matrius no poden tindre pivots. Si els tinguera, els sistemes serien incompatibles, ja que tindríem una equació del tipus \(0=1\). Per tant, les matrius associades als sistemes han de ser, necessàriament, de la forma \[ [\mathsf{A}| \mathsf{B}]= \begin{bmatrix} \begin{array}{c|c} 1&\beta_{1}\\ 0&0\\ \vdots&\vdots\\ 0&0 \end{array} \end{bmatrix} \qquad\qquad \qquad\qquad [\mathsf{C}| \mathsf{D}]= \begin{bmatrix} \begin{array}{c|c} 1&\delta_{1}\\ 0&0\\ \vdots&\vdots\\ 0&0 \end{array} \end{bmatrix} \]
Notem que el sistema \(\mathcal{U}\) són un grapat d’equacions del tipus \(0=0\) i una equació del tipus \(x=\beta_{1}\). Per tant, \(\beta_{1}\) és una solució del sistema d’equacions \(\mathcal{U}\). Com que \(\mathcal{U}\) i \(\mathcal{V}\) són sistemes equivalents, \(\beta_{1}\) també ha de ser una solució de \(\mathcal{V}\). Així s’ha de satisfer la primera equació de \(\mathcal{V}\), és a dir, \(x=\delta_{1}\), en substituïr \(x\) per \(\beta_{1}\). Aleshores \(\beta_{1}=\delta_{1}\) ha de ser certa. Concloem que les matrius \([\mathsf{A}| \mathsf{B}]\) i \([\mathsf{C}| \mathsf{S}]\) són iguals i, per tant, els sistemes \(\mathcal{U}\) i \(\mathcal{V}\) són iguals.
- Hipòtesi inductiva. Suposem l’enunciat cert per a sistemes amb, com a molt, \(n-1\) incògnites.
És a dir, si tenim dos sistemes compatibles amb, com a molt, \(n-1\) incògnites en forma normal i són equivalents, aleshores aquests dos sistemes són iguals.
Anem a demostrar l’enunciat per a \(\mathcal{U}\) i \(\mathcal{V}\), dos sistemes equivalents i compatibles d’\(m\) equacions amb \(n\) incògnites. Ara, les matrius associades als sistemes han de ser de la forma \[ [\mathsf{A}| \mathsf{B}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\alpha_{12}&\cdots&\alpha_{1n}&\beta_{1}\\ \hline 0&\\ \vdots&&\mathsf{A}'&& \mathsf{B}' \\ 0& \end{array} \end{bmatrix} \qquad\qquad [\mathsf{C}| \mathsf{D}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\gamma_{12}&\cdots&\gamma_{1n}&\delta_{1}\\ \hline 0&\\ \vdots&&\mathsf{C}'&& \mathsf{D}' \\ 0& \end{array} \end{bmatrix} \]
Considerem el sistema d’equacions \(\mathcal{U}'\) associat a la submatriu \([\mathsf{A}'|\mathsf{B}']\). Notem que les solucions del sistemes \(\mathcal{U}\) i \(\mathcal{U}'\) estan relacionades. Si \((a_{1},\cdots, a_{n})\) és una solució del sistema \(\mathcal{U}\), aleshores \((a_{2},\cdots, a_{n})\) és una solució del sistema \(\mathcal{U}'\). Per altra banda, si \((a_{2}, \cdots, a_{n})\) és una solució del sistema \(\mathcal{U}'\), aleshores \[ \left(\beta_{1}-\sum_{j=2}^{n}\alpha_{1j} a_{j},\, a_{2},\, \cdots,\, a_{n}\right) \] és una solució del sistema \(\mathcal{U}\).
De manera anàloga raonaríem per a \(\mathcal{V}'\), el sistema d’equacions associat a la submatriu \([\mathsf{C}'|\mathsf{D}']\).
Concloem que els sistemes \(\mathcal{U}'\) i \(\mathcal{V}'\) són compatibles i equivalents, ja que els sistemes \(\mathcal{U}\) i \(\mathcal{V}\) ho són. A més, com que les matrius \([\mathsf{A}|\mathsf{B}]\) i \([\mathsf{C}|\mathsf{D}]\) són esglaonades reduïdes per fila, les submatrius \([\mathsf{A}'|\mathsf{B}']\) i \([\mathsf{C}'|\mathsf{D}']\) també ho seran. Així, \(\mathcal{U}'\) i \(\mathcal{V}'\) són sistemes compatibles, tenen com a molt, \(n-1\) incògnites, estan en forma normal i són equivalents. Per hipòtesi inductiva són iguals. Aix les submatrius \([\mathsf{A}'|\mathsf{B}']\) i \([\mathsf{C}'|\mathsf{D}']\) són iguals.
Per tant, trobem que \[ [\mathsf{A}| \mathsf{B}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\alpha_{12}&\cdots&\alpha_{1n}&\beta_{1}\\ \hline 0&\\ \vdots&&\mathsf{A}'&& \mathsf{B}' \\ 0& \end{array} \end{bmatrix} \qquad\qquad [\mathsf{C}| \mathsf{D}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\gamma_{12}&\cdots&\gamma_{1n}&\delta_{1}\\ \hline 0&\\ \vdots&&\mathsf{A}'&& \mathsf{B}' \\ 0& \end{array} \end{bmatrix}. \]
Només queda demostrar que les primeres files són iguals. Considerem dos casos, en funció de si \(\mathsf{A}'\) té pivots o de que no en tinga.
- Cas 1. \(\mathsf{A}'\) té pivots
Primer de tot considerem el cas en què \(\mathsf{A}'\) tinga algun pivot. Aleshores aquest pivot es correspondrà a un pivot de la matriu \(\mathsf{A}\) que estarà en alguna posició del tipus \((i,j)\), amb \(2\leq j\leq n\). Com que \(\mathsf{A}\) està en forma esglaonada reduïda, aleshores l’entrada \(\alpha_{1j}=0\), ja que damunt del corresponent pivot trobem una columna de zeros. Com que \(\mathsf{A}'=\mathsf{C}'\), raonant de forma anàloga, trobem que \(\gamma_{1j}=0\).
Considerem el sistema d’equacions \(\mathcal{U}''\) associat a la submatriu \([1\,\alpha_{12}\,\cdots\,\alpha_{1n}\,|\beta_{1}]\). Definim el conjunt d’índexs \(I=\{k_{1},k_{2},\cdots, k_{r}\}\) satisfent que \(1=k_{1}<k_{2}<\cdots <k_{r}\leq n\) i que \(\alpha_{1k}\neq 0\) per a tot \(k\in I\). Aleshores podem pensar que \(\mathcal{U}''\) és un sistema amb \(r\) incògnites, és a dir, les incògnites associades a les entrades no nul·les de la matriu de coeficients \([1\,\alpha_{12}\,\cdots\,\alpha_{1n}]\). Com que \(\alpha_{1j}=0\) per a algun índex \(j\), amb \(2\leq j\leq n\), es té que el sistema d’equacions \(\mathcal{U}''\) té, com a molt, \(n-1\) incògnites.
Notem que les solucions del sistemes \(\mathcal{U}\) i \(\mathcal{U}''\) estan relacionades. Si \((a_{1},\cdots, a_{n})\) és una solució del sistema \(\mathcal{U}\), aleshores \((a_{1}, a_{k_{2}},\cdots, a_{k_{r}})\) és una solució del sistema \(\mathcal{U}''\). Per altra banda, si \((a_{1}, a_{2},\cdots, a_{r})\) és una solució del sistema \(\mathcal{U}''\), aleshores la tupla \((a'_{1},\cdots, a'_{n})\), on \[ a'_{j}= \begin{cases} a_{i}&\mbox{si }j=k_{i}\\ \lambda_{j}&\mbox{si }j\not\in I \mbox{ i $x_{j}$ no és principal}\\ \beta_{i}-\sum_{k=i+1}^{n}\alpha_{ik} a'_{k}&\mbox{si }j\not\in I \mbox{ i $x_{j}$ és principal per al pivot $\alpha_{ij}$} \end{cases} \] és una solució del sistema \(\mathcal{U}\), on els \(\lambda_{j}\) anteriors són paràmetres en \(\mathbb{K}\).
De manera anàloga raonaríem per a \(\mathcal{V}''\), el sistema d’equacions associat a \([1\,\gamma_{12}\,\cdots\,\gamma_{1n}\,|\delta_{1}]\).
Concloem que els sistemes \(\mathcal{U}''\) i \(\mathcal{V}''\) són compatibles i equivalents, ja que els sistemes \(\mathcal{U}\) i \(\mathcal{V}\) ho són. A més, les seues respectives matrius ampliades, és a dir, \([1\,\alpha_{12}\,\cdots\,\alpha_{1n}\,|\beta_{1}]\) i \([1\,\gamma_{12}\,\cdots\,\gamma_{1n}\,|\delta_{1}]\) són esglaonades reduïdes per fila. Així, \(\mathcal{U}''\) i \(\mathcal{V}''\) són sistemes compatibles, tenen com a molt, \(n-1\) incògnites, estan en forma normal i són equivalents. Per hipòtesi inductiva són iguals. Així trobem que les submatrius \([\mathsf{A}|\mathsf{B}]\) i \([\mathsf{C}|\mathsf{D}]\) són iguals.
- Cas 2. \(\mathsf{A}'\) no té pivots
Si la submatriu \(\mathsf{A}'\) no té pivots és perquè \(\mathsf{A}'=\mathsf{0}\). Com que el sistema \(\mathcal{U}\) és compatible, aleshores també s’ha de tindre que \(\mathsf{B}'=\mathsf{0}\). D’aquesta forma trobem que \([\mathcal{C}'|\mathcal{D}']=[\mathsf{0}|\mathsf{0}]\).
Per tant, ens trobem en el cas \[ [\mathsf{A}| \mathsf{B}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\alpha_{12}&\cdots&\alpha_{1n}&\beta_{1}\\ \hline 0&\\ \vdots&&\mathsf{0}&& \mathsf{0} \\ 0& \end{array} \end{bmatrix} \qquad\qquad [\mathsf{C}| \mathsf{D}]= \begin{bmatrix} \begin{array}{c|ccc|c} 1&\gamma_{12}&\cdots&\gamma_{1n}&\delta_{1}\\ \hline 0&\\ \vdots&&\mathsf{0}&& \mathsf{0} \\ 0& \end{array} \end{bmatrix}. \]
Notem que \((\beta_{1},0,\cdots, 0)\) és una solució d’\(\mathcal{U}\). Com que \(\mathcal{U}\) i \(\mathcal{V}\) són equivalents, s’ha de satisfer l’equació \(\beta_{1}=\delta_{1}\). Per altra banda, per a cada índex \(j\) amb \(2\leq j\leq n\), es té que la tupla \((a^{j}_{1},\cdots, a^{j}_{n})\), on \[ a^{j}_{k}= \begin{cases} \beta_{1}-\alpha_{1j}&\mbox{si }k=1\\ 1&\mbox{si }k=j\\ 0&\mbox{si }k\neq 1,j \end{cases} \] és solució d’\(\mathcal{U}\). Com que \(\mathcal{U}\) i \(\mathcal{V}\) són equivalents, s’ha de satisfer l’equació \(\beta_{1}-\alpha_{1j}+\gamma_{1j}=\delta_{1}\). Com ja hem vist que \(\beta_{1}=\delta_{1}\), l’última equació se simplifica fins obtindre \(\alpha_{1j}=\gamma_{1j}\).
Així trobem que les submatrius \([\mathsf{A}|\mathsf{B}]\) i \([\mathsf{C}|\mathsf{D}]\) són iguals.
Açò conclou la demostració del Lema 1.
Observació. En la demostració del Lema 1 és necessari que els sistemes siguen compatibles. Notem que els següents sistemes d’equacions són incompatibles, per tant són equivalents, en ser del mateix tamany, i estan en forma normal, però no són iguals. \[ \begin{array}{ccc} \left. \begin{array}{ccccc} x &+ &y &= &0\\ & &z &= &0\\ & &0 &= &1\\ \end{array} \right\rbrace &\qquad\qquad\qquad\qquad \left. \begin{array}{ccccc} x &+ &z &= &0\\ & &y &= &0\\ & &0 &= &1\\ \end{array} \right\rbrace \end{array} \]
Acabem aquesta secció amb una serie de resultats que són conseqüència directa del resultat d’unicitat que acabem de vore. El següent resultat ens diu que les dues relacions considerades fins al moment sobre sistemes d’equacions, és a dir, ser equivalents i ser equivalents per files, són iguals pel que respecta als sistemes compatibles.
Corol·lari 2 Siguen \(\mathcal{S}\) i \(\mathcal{T}\) dos sistemes d’\(m\) equacions i \(n\) incògnites compatibles. Les següents afirmacions són equivalents
- \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents per files.
- \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents.
Demostració. Si \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents per files, aleshores podem trobar una seqüència finita d’operacions elementals fila que permeten transformar el sistema \(\mathcal{S}\) en el sistema \(\mathcal{T}\). Les Proposicions 1, 2 i 3 garantitzen que tots els sistemes que trobem en aquest procés de transformació seran equivalents. En particular, \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents.
Per a l’altra implicació, suposem que \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents. Apliquem Gauss-Jordan sobre \(\mathcal{S}\) fins a obtindre \(\mathcal{U}\), un sistema d’equacions en forma normal equivalent amb \(\mathcal{S}\). Com \(\mathcal{S}\) és compatible, \(\mathcal{U}\) també ho és. Per altra banda, apliquem Gauss-Jordan sobre \(\mathcal{T}\) fins a obtindre \(\mathcal{V}\), un sistema d’equacions en forma normal equivalent amb \(\mathcal{T}\). Com \(\mathcal{T}\) és compatible, \(\mathcal{V}\) també ho és. Com que \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents, els sistemes \(\mathcal{U}\) i \(\mathcal{V}\) també són equivalents. Així hem trobat dos sistemes, \(\mathcal{U}\) i \(\mathcal{V}\), que són compatibles, equivalents i es troben en forma normal. Pel Lema 1, concloem que \(\mathcal{U}=\mathcal{V}\).
Ara, per a transformar el sistema \(\mathcal{S}\) en el sistema \(\mathcal{T}\) mitjançant una seqüència finita de transformacions elemental fila farem com segueix: Passem del sistema \(\mathcal{S}\) al sistema \(\mathcal{U}\) seguint el procés de Gauss-Jordan que transformava \(\mathcal{S}\) en \(\mathcal{U}\). Ara, des del sistema \(\mathcal{U}\), que és el mateix que \(\mathcal{V}\), desfem el procés de Gauss-Jordan que transformava \(\mathcal{T}\) en \(\mathcal{V}\). Açò permet trobar una seqüència finita de transformacions elemental fila que permeten transformar el sistema \(\mathcal{S}\) en el sistema \(\mathcal{T}\). És a dir, \(\mathcal{S}\) i \(\mathcal{T}\) són equivalents per fila.
En el Corol·lari 1 ja vam vore que tota matriu és equivalent per files a una matriu en forma esglaonada reduïda per files. L’últim corol·lari d’aquesta secció ens garantitza la unicitat d’aquesta matriu en forma esglaonada reduïda.
Corol·lari 3 Siga \(\mathsf{A}\) una matriu en \(\mathrm{M}_{mn}(\mathsf{K})\). Aleshores \(\mathsf{A}\) és equivalent per files a una única matriu en forma esglaonada reduïda per files.
Demostració. Suposem que \(\mathsf{A}\) és equivalent per files a dues matrius esgalonades reduïdes per fila \(\mathsf{B}\) i \(\mathsf{C}\). Al seu torn, \(\mathsf{B}\) i \(\mathsf{C}\) són equivalents per fila. Considerem els sistemes d’equacions homogenis \(\mathcal{U}\) i \(\mathcal{V}\) associats a les matrius ampliades \([\mathsf{B}|\mathsf{0}]\) i \([\mathsf{C}|\mathsf{0}]\), respectivament. Els sistemes \(\mathcal{U}\) i \(\mathcal{V}\) són del mateix tamany, compatibles, equivalents i es troben en forma normal. Pel Lema 1, concloem que \(\mathcal{U}=\mathcal{V}\). Per tant, \(\mathsf{B}=\mathsf{C}\).
3 Teorema de Rouché-Frobenius
El teorema de Rouché-Frobenius permet saber el nombre de solucions d’un sistema d’equacions en funció de la matriu de coeficients, de la matriu ampliada i del nombre d’incògnites associades al sistema. Per a fer-ho introduïm la noció de rang d’una matriu.
Definició 8 (Rang d’una matriu) Siga \(\mathsf{A}\) una matriu en \(\mathrm{M}_{mn}(\mathsf{K})\). Definim el rang de la matriu \(\mathsf{A}\), denotat per \(\mathrm{rang}(\mathsf{A})\), com el nombre de pivots de l’única matriu esglaonada reduïda per files que resulta d’aplicar el mètode de Gauss-Jordan a la matriu \(\mathsf{A}\). Notem que la noció de rang d’una matriu està ben definida pel Corol·lari 3.
Observació. De la pròpia definició de matriu esglaonada reduïda per files i de la definició de rang es dedueix que, per a tota matriu \(\mathsf{A}\) en \(\mathrm{M}_{mn}(\mathsf{K})\), s’ha de satisfer la desigualtat \(\mathrm{rang}(\mathsf{A})<\mathrm{min}(m,n)\).
Teorema 1 (Teorema de Rouché-Frobenius) Siga \(\mathcal{S}\) un sistema d’\(m\) equacions i \(n\) incògnites sobre \(\mathbb{K}\) i siga \([\mathsf{A} | \mathsf{B}]\) la seua matriu ampliada. Es té que
El sistema d’equacions \(\mathcal{S}\) és compatible si, i només si, \(\mathrm{rang}(\mathsf{A})=\mathrm{rang}([\mathsf{A}| \mathsf{B}])\).
El sistema d’equacions \(\mathcal{S}\) és compatible determinat si, i només si, \(\mathrm{rang}(\mathsf{A})=\mathrm{rang}([\mathsf{A}| \mathsf{B}])=n\).
El sistema d’equacions \(\mathcal{S}\) és compatible indeterminat si, i només si, \(\mathrm{rang}(\mathsf{A})=\mathrm{rang}([\mathsf{A}| \mathsf{B}])<n\). En aquest cas, tota solució del sistema d’equacions \(\mathcal{S}\) dependrà d’\(n-\mathrm{rang}(\mathsf{A})\) paràmetres.
Demostració. Notem que \(\mathrm{rang}(\mathsf{A})\leq\mathrm{rang}([\mathsf{A}|\mathsf{B}])\leq\mathrm{rang}(\mathsf{A})+1\), ja que la matriu ampliada només té una columna més que la matriu de coeficients.
Si suposem que \(\mathrm{rang}([\mathsf{A}|\mathsf{B}])\neq\mathrm{rang}(\mathsf{A})\) és perquè \([\mathsf{A}\mid\mathsf{B}]\) té un pivot en l’última columna, és a dir, podem transformar la matriu \([\mathsf{A}\mid\mathsf{B}]\) mitjançant una seqüència finita d’operacions elementals fila en un matriu que tinga una fila del tipus \[ \begin{bmatrix} \begin{array}{ccc|c} \vdots &\ddots &\vdots &\vdots\\ 0 &\dots &0 &1\\ \vdots &\ddots &\vdots &\vdots \end{array} \end{bmatrix} \]
El sistema associat és incompatible, ja que té una equació del tipus \(0=1\). Aleshores el sistema original és incompatible.
Suposem ara que \(\mathrm{rang}([\mathsf{A}|\mathsf{B}])=\mathrm{rang}(\mathsf{A})\). Aleshores podem distingir dos casos; que totes les incògnites siguen principals, o que no totes les incògnites siguen principals.
- Cas 1. Totes les incògnites són principals.
En aquest cas, necessàriament es té que \(m\geq n\). A més, podem trobar una seqüència finita d’operacions elementals fila que transformen la matriu ampliada del sistema en una del tipus \[ \begin{bmatrix} \begin{array}{cccc|c} 1 &0 &\dots &0 &\delta_{1}\\ 0 &1 &\dots &0 &\delta_{2}\\ \vdots &\vdots &\ddots &\vdots &\vdots\\ 0 &0 &\dots &1 &\delta_{n}\\ 0 &0 &\dots &0 &0\\ \vdots &\vdots &\ddots &\vdots &\vdots\\ 0 &0 &\dots &0 &0\\ \end{array} \end{bmatrix} \]
Aleshores, la tupla \((\delta_{1},\cdots, \delta_{n})\) és l’única solució d’aquest sistema. Per tant, el sistema original és compatible determinat. Notem que, en aquest cas, \(\mathrm{rang}(\mathsf{A})=\mathrm{rang}([\mathsf{A}|\mathsf{B}])=n\).
- Cas 2. No totes les incògnites són principals.
Apliquem Gauss-Jordan a la matriu \([\mathsf{A} | \mathsf{B}]\) fins obtindre una matriu en forma esglaonada reduïda per files de la forma \[ \begin{bmatrix} \begin{array}{cccc|c} 1&\gamma_{12}&\cdots&\gamma_{1n}&\delta_{1}\\ 0&\gamma_{22}&\cdots&\gamma_{2n}&\delta_{2}\\ \vdots&\vdots&\ddots&\vdots&\vdots \\ 0&\gamma_{m2}&\cdots&\gamma_{mn}&\delta_{m} \end{array} \end{bmatrix}. \]
Considerem el conjunt \(P\) d’índexs associats a incògnites principals \[P=\{j\in \mathbb{N}\mid 1\leq j\leq n,\, x_{j} \mbox{ és variable principal}\}.\] Notem que \(\left| P\right|=\mathrm{rang}(\mathsf{A})\). Aleshores la tupla \((a_{1},\cdots, a_{n})\), on \[ a_{j}= \begin{cases} \lambda_{j}&\mbox{si } j\not\in P\\ \beta_{i}-\sum_{k=i+1}^{n}\gamma_{ik} a_{k}&\mbox{si }j\in P \mbox{ i $x_{j}$ és principal per al pivot $\gamma_{ij}$} \end{cases} \] és una solució del sistema \(\mathcal{S}\), on els \(\lambda_{j}\) anteriors són paràmetres en \(\mathbb{K}\). És a dir el sistema és compatible indeterminat i la solució depén de \(n-\mathrm{rang}(\mathsf{A})\) paràmetres.
Corol·lari 4 Per a que un sistema d’equacions amb \(n\) incògnites siga compatible determinat, ha de tindre almenys \(n\) equacions.