Ugrás a tartalomhoz

Lineáris algebra

Freud Róbert (2014)

ELTE Eötvös Kiadó

7.2. Ortogonalizálás

7.2. Ortogonalizálás

Legyen V továbbra is egy véges dimenziós vektortér a valós test fölött. Ebben a pontban azt vizsgáljuk, mikor létezik egy A bilineáris függvénynek „szép” mátrixa, nevezetesen mely A-khoz található olyan bázis, amelyben A mátrixa diagonális (azaz a főátlón kívül minden elem nulla). Kiderül, hogy a transzformációknál tapasztaltakhoz képest itt jóval kedvezőbb a helyzet. Könnyen adódik az az egyszerű szükséges feltétel, hogy A szimmetrikus legyen. Meglepő, hogy ez egyben elégséges is a diagonalizálhatósághoz.

7.2.1 Definíció

Egy A bilineáris függvény szimmetrikus, ha minden u_,v_V-re Αu_,v_=Αv_,u_

Az előző pont példái közül szimmetrikus volt a skalárszorzat, a nulla függvény és a P3 példában másodiknak megadott függvény, de nem volt szimmetrikus az ottani első függvény.

7.2.2 Tétel

Egy A bilineáris függvény akkor és csak akkor szimmetrikus, ha (akármelyik bázisban felírt) mátrixa szimmetrikus (azaz megegyezik a transzponáltjával).❶

Bizonyítás: Ha az A bilineáris függvény szimmetrikus, akkor a szimmetriát speciálisan a b_i báziselemekre kihasználva αij=Αb_i,b_j=Αb_j,b_i=αij adódik, tehát a mátrix is szimmetrikus. Megfordítva, ha αijji, akkor pl. a 7.1.4 Tétel (1) képletéből leolvasható Αu_,v_=Αv_,u_ tehát ekkor az A bilineáris függvény is szimmetrikus.❷

Most rátérünk a diagonalizálhatóság kérdésére. Először tegyük fel, hogy A-nak létezik diagonális mátrixa. Mivel egy diagonális mátrix eleve szimmetrikus, így (az előző tétel alapján) ekkor A-nak mindenesetre szimmetrikusnak kell lennie. Mint a bevezetőben már említettük, a megfordítás is igaz:

7.2.3 Tétel

Legyen A szimmetrikus bilineáris függvény V-n. Ekkor létezik olyan bázis, amelyben A mátrixa diagonális.❶

Mielőtt rátérnénk a bizonyításra, néhány magyarázó megjegyzést teszünk. A diagonális mátrix pontosan azt jelenti, hogy a szóban forgó c_1,,c_n bázisban Αc_i,c_j=0 ha ij. Ha speciálisan a bilineáris függvény a sík- vagy térvektorok szokásos skalárszorzata, akkor Αu_,v_=0 azt jelenti, hogy u_ és v_ egymásra merőlegesek, vagy — görög-latin eredetű szóval — ortogonálisak. Ennek általánosítása a következő

7.2.4 Definíció

Legyen A szimmetrikus bilineáris függvény. Az u_,v_V vektorok A-ortogonálisak, ha Αu_,v_=0

Ennek alapján a 7.2.3 tételt úgy is megfogalmazhatjuk, hogy egy A szimmetrikus bilineáris függvényhez mindig található A-ortogonális bázis.

A tételre három bizonyítást adunk. Ezek közül az első nem teljes, mert a szimmetrikus bilineáris függvényeknek csak egy bizonyos — bár mint később látni fogjuk, talán a legfontosabb — osztályára alkalmazható. Ugyanakkor a bizonyítás nagy előnye, hogy meg is konstruál egy A-ortogonális bázist. A második és harmadik bizonyítás bármely szimmetrikus bilineáris függvényre működik, és ezek is alkalmasak A-ortogonális bázis tényleges megadására. A második bizonyítás alapgondolata hasonló az elsőéhez, de az általános eset kezeléséhez néhány technikai jellegű módosításra van szükség. A harmadik bizonyítás a Gauss-elimináció segítségével diagonalizálja A mátrixát. Mindegyik bizonyítás után (ugyanazon a) konkrét példán illusztráljuk a módszert.

A 7.2.3 Tétel első bizonyítása (Gram-Schmidt ortogonalizáció): Feltesszük, hogy Αu_,u_0 ha u_0_ Legyen b_1,,b_n tetszőleges bázis V-ben. Ebből gyártunk egy c_1,,c_nA-ortogonális bázist, amelynek elemeit rekurzíve konstruáljuk meg a következő séma szerint:

ahol a ρqs skalárokat később alkalmasan megválasztjuk.

Először azt mutatjuk meg, hogy a c_1,,c_n vektorok a ρqs skalárok tetszőleges értéke esetén bázist alkotnak V-ben. Mivel n=dim V, ezért elég azt igazolni, hogy c_1,,c_n generátorrendszer, és ehhez elég azt belátni, hogy mindegyik b_j előáll a c_i-k lineáris kombinációjaként. Ez viszont azonnal következik a c_j-re felírt egyenletből, ha onnan b_j-t (c_1,,c_j segítségével) kifejezzük.

Most azt igazoljuk, hogy a ρqs együtthatók alkalmas megválasztásával a c_i vektorok A-ortogonálisak lesznek. Ehhez a c_j-ket úgy fogjuk egymás után meghatározni, hogy a c_j vektor A-ortogonális legyen c_1,,c_j-1 mindegyikére.

Nézzük először c_2-t. Erre az egyetlen feltétel Αc_2,c_1=0 teljesülése. Írjuk be ide c_2 előállítását:

Innen 21=-Αb_2,c_1/ Αc_1,c_1 (A feltevésünk szerint a nevező nem nulla.)

Hasonlóan okoskodhatunk általában is. Tegyük fel, hogy c_1,,c_m-1-ről az első m–1 egyenlet alapján már tudjuk, hogy A-ortogonálisak. Legyen j<m tetszőleges és nézzük, milyen követelményt jelent c_m és c_jA-ortogonalitása az m-edik egyenletben:

Ha i<m és ij, akkor c_i és c_jA-ortogonalitását már tudjuk, tehát Αc_i,c_j=0 és az előző feltétel így a 0=Αb_m,c_j+mjΑc_j,c_j alakra redukálható, ahonnan mj=-Αb_m,c_j/Αc_j,c_j Ezzel igazoltuk, hogy az m-edik egyenletbeli ρmj együtthatók valóban megválaszthatók úgy, hogy c_m a c_1,,c_m-1 vektorok mindegyikére A-ortogonális legyen.❷

Megjegyzések: Az Αu_,u_0 feltételt csak az egymás után adódó c_1,,c_n-1 vektorokra kellett felhasználnunk. Így szerencsés esetben az eljárás olyankor is működhet, ha az Αu_,u_ értékek között ugyan előfordul (nemtriviálisan) a nulla, de az ortogonalizáció során nem botlunk ilyen u_-kba (ilyen lesz az alább tárgyalt illusztrációs példa is).

Egy vektortérben egy adott A-hoz nagyon sokféle A-ortogonális bázis létezik. Ez már a fenti bizonyításból is kiderül, hiszen más és más b_i bázisból kiindulva általában különböző c_i bázisokhoz jutunk.

Még egyszer hangsúlyozzuk, hogy a bizonyítás egyúttal a gyakorlatban is jól használható eljárást adott A-ortogonális bázis konstrukciójára. Ezt most egy konkrét példával illusztráljuk.

Példa: Legyen V=R3, az u_, illetve v_ vektor komponenseit jelölje u1, u2, u3, illetve v1, v2, v3. Keressünk A-ortogonális bázist és diagonális mátrixot a következő szimmetrikus bilineáris függvényhez:

(*)

Vegyük kiinduló bázisnak a szokásos b_1=100, b_2=010, b_3=001 egységvektorokat. A konstrukció szerint c_1=b_1 Ezután c_2=b_2+21c_1 Az Αc_2,c_1=0 feltételből megkapjuk ρ21-et:

ahonnan ρ21=–1/2. Így

(Ha nem akarunk törtekkel számolni, akkor nyugodtan beszorozhatjuk c_2-t egy nemnulla skalárral, hiszen az A-ortogonalitáson ez nem változtat.) Hasonlóan továbbhaladva, a

előállításban az Αc_3,c_1=0 feltételből ρ31=–1/2, az Αc_3,c_2=0 feltételből pedig ρ32=1 adódik. Innen

Ezzel megkaptunk egy c_1,c_2,c_3A-ortogonális bázist. Az ennek megfelelő diagonális mátrix főátlójába az AΑc_i,c_i értékek kerülnek, így

A 7.2.3 Tétel második bizonyítása: Először azt igazoljuk, hogy ha minden u_V-re Αu_,u_=0 akkor A a(z azonosan) nulla bilineáris függvény, azaz minden u_,v_V-re Αu_,v_=0 Ez rögtön adódik az

összefüggésből.

Rátérve a tétel bizonyítására, ha A a nulla függvény, akkor bármely bázis A-ortogonális (A mátrixa a nullmátrix). Egyébként válasszunk egy tetszőleges olyan d_ vektort, amelyre Αd_,d_0 (ilyen vektor az előzetes megjegyzés szerint biztosan létezik).

Tekintsük a d_-re A-ortogonális összes vektor W halmazát, azaz

Megmutatjuk, hogy W altér, és V minden v_ eleme egyértelműen írható fel

(1)

alakban, ahol w_W (vagyis V a d_ és W alterek direkt összege).

W nem az üres halmaz, mert a 0_ mindenképpen eleme, továbbá egyszerű számolással ellenőrizhető, hogy az összeadásra és a skalárral való szorzásra zárt, tehát valóban altér. Az (1)-beli felírás azzal ekvivalens, hogy v_-λd_W azaz Αd_,v_-λd_=0 Ez átírható az Αd_,v_-λΑd_,d_=0 alakba, ahonnan adódik, hogy a feltételeknek pontosan egy λ érték felel meg: λ=Αd_,v_/ Α(d_,d_)

Ezután válasszuk a keresett A-ortogonális bázis első elemének d_-t, és ismételjük meg a fenti eljárást a(z eggyel) kisebb dimenziós W altérre stb. Így legfeljebb dim V–1 lépésben egy A-ortogonális bázist kapunk. [Az eljárás akkor ér véget hamarabb, ha közben valamelyik (legalább kétdimenziós) altéren az A (megszorítása) már azonosan nulla.]❷

Az első és a második bizonyítást összevetve, az első az alterek egyre bővülő láncában épít fel A-ortogonális rendszert, a második pedig tulajdonképpen fordított irányban haladva alterek egyre szűkülő láncán keresztül jut el egy ilyen rendszerhez.

A második bizonyítással kapcsolatban megjegyezzük, hogy W tulajdonságainak az igazolását a mátrixok segítségével, a [d_]TΑw_=0 egyenletből is megkaphattuk volna, és ennek segítségével egyúttal W elemeit is ténylegesen elő tudjuk állítani. Ily módon ténylegesen meg is konstruálhatunk egy A-ortogonális bázist. Nézzük meg ezt a gyakorlatban az első bizonyítás utáni (*) példán.

Az A mátrixa az eredeti b_i bázisban 422202220 Próbálkozzunk indulásként most is a d_=b_1 vektorral. Ez megfelel, mert Αb_1,b_1=40 Keressük most meg a d_-re A-ortogonális w_ vektorokat az Αd_,w_=[d_]TΑw_=0 egyenletből:

tehát W elemei a w_=αβ-2α-β alakú vektorok. Ezek között kell most folytatni az ortogonalizálást [hiszen ezek valamennyien A-ortogonálisak az elsőként választott 100 vektorra]. Második vektornak megfelel pl. (az α=1, β=0 értékekből adódó) d_2=10-2 mert Αd_2,d_2=-40 A d_2-re W-n belül A-ortogonális vektorokat a

azaz β=–α feltételből kapjuk meg, ezek a vektorok tehát α-α-α alakúak. (Ezen az egydimenziós altéren az A egyébként már a nulla függvény.) Így az A-ortogonális bázis utolsó elemének pl. (α=1 választással) 1-1-1 vehető. A bilineáris függvény mátrixa ebben a bázisban 4000-40000

A 7.2.3 Tétel harmadik bizonyítása: Írjuk fel A mátrixát egy tetszőleges b_1,,b_n bázisban. A 7.1.6 feladatbeli változtatásokat fogjuk alkalmazni. Ezek tulajdonképpen a jól ismert elemi ekvivalens átalakítások, csak most mindig együtt kell végrehajtani ugyanazt az átalakítást a sorokra és a megfelelő oszlopokra is. Vegyük észre azt is, hogy egy-egy ilyen együttes lépés a mátrix szimmetriáját nem rontja el.

Foglaljuk össze, mik ezek a lépések és hogyan változik ekkor a mátrix. (a) Két báziselemet felcserélve a mátrix megfelelő sorait és oszlopait kell felcserélni. (b) A b_i báziselemet egy λ≠0 skalárral szorozva az i-edik sor és oszlop λ-val szorzódik, és speciálisan αii a λ2-szeresére változik. (c) Ha b_i helyére b_i+μb_j kerül (ji), akkor az i-edik sorhoz, illetve oszlophoz hozzáadjuk a j-edik sor, illetve oszlop μ-szörösét, és speciálisan az új i-edik sor i-edik eleme α’iiii+μαji+μαij2αjj lesz.

Nézzük, hogyan működik a fenti lépésekkel végzett módosított Gauss-kiküszöbölés. Ha a bal felső sarokban álló elem nem nulla, akkor a többi sorból, illetve oszlopból az első sor, illetve oszlop megfelelő többszöröseit levonva az első sor és oszlop többi eleme nullává válik. Ha a bal felső sarokban nulla állt, de a főátló valamelyik másik eleme nem nulla, akkor egy sor- és oszlopcserével elérhetjük, hogy ez a nemnulla elem kerüljön a bal felső sarokba. Ha a főátló elemei nullák, de az első oszlop és sor (mondjuk) harmadik eleme (α1331) nem volt nulla, akkor adjuk hozzá az első sorhoz/oszlophoz a harmadik sort/oszlopot, ekkor a bal felső sarokba α11’=α11+2α3133=2α31≠0 került, és ezután indulhat a kivonogatás. Ha az első sor és oszlop minden eleme eleve nulla volt, akkor (egyelőre) ne csináljunk semmit.

Így elértük, hogy az első sorban és az első oszlopban az első elemtől (esetleg) eltekintve minden további elem nulla. Ezen a soron és oszlopon később már nem változtatunk. Most ugyanezt az eljárást megismételjük a többi sor és oszlop alkotta ugyancsak szimmetrikus, eggyel kisebb méretű mátrixra (ezek az átalakítások az első sort és oszlopot nem befolyásolják). Ugyanígy továbbhaladva, végül egy diagonális mátrixhoz jutunk.❷

Látjuk, hogy a harmadik bizonyítás is egy nagyon kényelmes eljárást ad a diagonális mátrix megkereséséhez. A módszer a megfelelő A-ortogonális bázist is előállítja, ha nyomon követjük, hogy az egyes mátrixlépések során hogyan változott a bázis. Ezt ismét az előző bizonyítások után már megvizsgált (*) példán illusztráljuk.

A kiinduló bázis b_1,b_2,b_3 a mátrix 422202220 A második sorból levonjuk az első sor felét, majd a második oszlopból levonjuk az (új!) első oszlop felét. Ezzel a bázisunk és a mátrixunk a következőképpen változott:

Új bázis: b_1,b_2-(1/2)b_1,b_3  új mátrix: 4020-11210

Most a harmadik sorból/oszlopból vonjuk le az első sor/oszlop felét:

Új bázis: b_1,b_2-1/2b_1,b_3-1/2b_1 új mátrix: 4000-1101-1

Végül a harmadik sorhoz/oszlophoz adjuk hozzá a második sort/oszlopot:

Új bázis: b_1,b_2-1/2b_1,b_3+b_2-b_1 új mátrix: 4000-10000

Az így nyert A-ortogonális bázis ugyanaz, mint amit az első bizonyítás módszerével gyártottunk. A szimmetrikus bilineáris függvény mátrixát kicsit még tovább „szépíthetjük”: az A-ortogonális bázisvektorokat alkalmas skalárszorosukkal helyettesítve az is elérhető, hogy a diagonális mátrix főátlójában csak ±1 és 0 szerepeljenek. Ezt a bázist használva a bilineáris függvény — a skalárszorzathoz nagyon hasonló — igen egyszerű alakot ölt. Mindezt pontosan a következő tételben fogalmazzuk meg.

7.2.5 Tétel

Bármely A szimmetrikus bilineáris függvénynek létezik olyan mátrixa, amelyben a főátló elemei csak az 1, a –1 és a 0 közül kerülhetnek ki, a főátlón kívül pedig minden elem 0.

Az ilyen mátrixot adó bázisban a bilineáris függvény az Αu_,v_=i=1nγiuivi alakra egyszerűsödik, ahol γi=±1 vagy 0 és u1, …, un, illetve v1, …, vn az u_ illetve v_ vektorok koordinátáit jelölik.❶

A skalárszorzat ennek speciális esete, amikor mindegyik γi=1.

Bizonyítás: Legyen c_1,,c_n egy A-ortogonális bázis és Αc_i,c_i=μi A c_i-ket alkalmas skalárral megszorozva a következőképpen „normáljuk”: ha μi=0, akkor legyen e_i=c_i ha pedig μi≠0, akkor legyen e_i=(1/μi)c_i [Ez tulajdonképpen az előző tétel harmadik bizonyításában jelzett, de ott fel nem használt (b) típusú átalakítás.] Ekkor az e_i vektorok is A-ortogonálisak, és Αe_i,e_i=±1 illetve 0, aszerint, hogy μi pozitív, negatív, illetve nulla volt. Így az A-nak az e_i bázisban felírt mátrixa a kívánt tulajdonságú lesz.

A tétel második állítása azonnal adódik a 7.1.4 Tételből.❷

Amint korábban említettük, egy bilineáris függvényhez sokféle A-ortogonális bázis található. A diagonális mátrix azonban bizonyos szempontból már nagyon behatárolt:

7.2.6 Tétel (Tehetetlenségi tétel)

Egy bilineáris függvény diagonális mátrixában (a főátlóban) a pozitív, a negatív és a nulla elemek száma egyértelműen meghatározott.❶

Bizonyítás: Tekintsük az A két diagonális mátrixát. Jelölje a főátlóbeli pozitív, negatív és nulla elemek számát a két mátrixban rendre r, s, t, illetve r’, s’, t’ (bármelyik darabszám nulla is lehet, továbbá r+s+t=r’+s’+t’=dim V). Legyen ennek megfelelően az egyik A-ortogonális bázis

ahol

a másik bázist pedig hasonló módon alkossák az m_i', n_j', o_k' vektorok.

Először megmutatjuk, hogy a „vesszőtlen” m_i, o_k és a „vesszős” n_j' összesen r+t+s’ darab vektor (együttesen) lineárisan független rendszert alkot. Tekintsük ehhez egy olyan lineáris kombinációjukat, ami 0_-t ad, és rendezzük át ezt úgy, hogy a bal oldalra a „vesszőtlen”, a jobb oldalra pedig a „vesszős” vektorok kerüljenek:

(2)

Elég belátnunk, hogy a két oldal közös értéke 0_ Ekkor ugyanis az m_i,o_k vektorok lineáris függetlensége miatt a bal oldalon minden együttható 0, és az n_j' vektorok függetlenségét felhasználva ugyanez adódik a jobb oldalon is, tehát valóban valamennyi együttható 0.

Jelöljük (2)-ben a két oldal közös értékét u_-val. Mivel u_ az m_i és o_k vektorok lineáris kombinációja, ezért a bilineáris függvény 7.1.4 Tételbeli képlete szerint

(3)

Ugyanígy, lévén u_ az n_j' vektorok lineáris kombinációja is,

(4)

A (3) és (4) egyenlőtlenségekből kapjuk, hogy Αu_,u_=0 és ekkor (4) alapján valóban csak u_=0_ lehetséges.

Ezzel beláttuk, hogy az m_i, o_k és n_j' vektorok (együttesen is) lineárisan függetlenek.

Mivel egy lineárisan független rendszer elemszáma nem lehet nagyobb a dimenziónál, így r+t+s’≤dim V=r+t+s, ahonnan s’s. Fordított szereposztással kapjuk, hogy ss’, tehát s=s’.

Az m_-ek és n_-ek szerepét felcserélve ugyanígy adódik r=r’. Végül t=dim Vrs=dim Vr’s’=t’.❷

Feladatok

7.2.1 Egy bilineáris függvényt antiszimmetrikusnak nevezünk, ha minden u_,v_V-re Αu_,v_=-Αv_,u_ Mutassuk meg, hogy A akkor és csak akkor antiszimmetrikus, ha minden x_V-re Αx_,x_=0

7.2.2 Bizonyítsuk be, hogy minden bilineáris függvény egyértelműen előállítható egy szimmetrikus és egy antiszimmetrikus bilineáris függvény összegeként.

7.2.3 Tekintsük a V-n értelmezett bilineáris függvények B vektorterét, amelyről a 7.1.5 feladatban volt szó.

a) Mutassuk meg, hogy B-ben a szimmetrikus, illetve antiszimmetrikus függvények egy S, illetve A alteret alkotnak.

b) Hány dimenziós altér S, illetve A?

c) Lássuk be, hogy a B vektortér az S és A alterek direkt összege.

7.2.4 Ha A bilineáris függvény V-n, akkor az A (pontosabban az A megszorítása) a V bármely alterén is bilineáris. Legyenek U és W alterek V-ben. Melyek igazak az alábbi állítások közül?

a) Ha A szimmetrikus U,W-n, akkor szimmetrikus U-n és W-n is.

b) Ha A szimmetrikus U-n és W-n, akkor szimmetrikus U,W-n is.

7.2.5 Legyen S a szokásos skalárszorzat R4-ben. Jelölje egy általános u_R4 vektor komponenseit u1, u2, u3, u4. Adjunk meg S-ortogonális bázist R4 alábbi alterein:

a) U1=u_  u1=u4

b) U2=u_  u1,,u4 számtani sorozat

c) U3=u_  i=14ui=0

7.2.6 Legyen V a legfeljebb 4-edfokú valós együtthatós polinomok (beleértve a 0 polinomot is) szokásos vektortere. Írjuk fel az alábbi szimmetrikus bilineáris függvények egy-egy diagonális mátrixát, és adjunk is meg egy-egy A-ortogonális bázist. Legyen f,g képe

 a) f(1)g(1); b) fg-ben x2 együtthatója; c) f(1)g(1)+f(2)g(2)+f(3)g(3)+f(4)g(4)+f(5)g(5).

7.2.7 Legyen dim V=3, az u_ illetve v_ vektorok koordinátáit egy rögzített b_1,b_2,b_3 bázisban jelölje u1, u2, u3, illetve v1, v2, v3. Adjuk meg az alábbi bilineáris függvények egy-egy diagonális mátrixát és A-ortogonális bázisát.

 a) i,j=13ijuivj b) i,j=13(i+j-1)uivj

7.2.8 Bizonyítsuk be, hogy ha az A szimmetrikus bilineáris függvényhez találhatók olyan u_,v_V vektorok, amelyekre Αu_,u_>0 és Αv_,v_<0 akkor van olyan 0_w_V is, amelyre Αw_,w_=0

M 7.2.9 Legyen dim V=n, A egy szimmetrikus bilineáris függvény V-n és v_V Lássuk be, hogy a v_-re A-ortogonális vektorok alteret alkotnak V-ben. Hány dimenziós lehet ez az altér?

M 7.2.10 Nevezzünk két, ugyanazon a V vektortéren értelmezett bilineáris függvényt, A-t és B-t ekvivalensnek, ha „van közös mátrixuk”, azaz van olyan a_1,,a_n illetve b_1,,b_n bázis, hogy [B]b=[A]a. Hány páronként nemekvivalens szimmetrikus bilineáris függvény létezik V-n?