Teoremi di Gershgorin

teoremi sulla localizzazione degli autovalori di una matrice nel campo complesso
(Reindirizzamento da Secondo teorema di Gershgorin)

In matematica, e più precisamente in algebra lineare, i teoremi di Gershgorin sono tre teoremi riguardanti la localizzazione degli autovalori di una matrice a termini nel campo complesso. Il nome di questi teoremi è dovuto a quello del matematico bielorusso Semyon Aranovich Gershgorin, che per primo li ha enunciati nel 1931.

Cerchi di Gershgorin

modifica
 
Rappresentazione nel piano complesso dei cerchi di Gershgorin della matrice  . Le croci indicano la posizione effettiva degli autovalori[1].

Una definizione di basilare importanza nella comprensione di questi teoremi è quella del cerchio di Gershgorin.

Sia   una matrice in  . Si consideri l'elemento  -esimo   della diagonale principale di   e la somma dei moduli degli elementi della riga  -esima fuori della diagonale:

 

Queste due quantità individuano il seguente sottoinsieme del piano complesso:

 

corrispondente ad un disco di raggio   centrato in  , che viene detto  -esimo cerchio di Gershgorin della matrice  .

Primo teorema di Gershgorin

modifica
Teorema. Sia   e sia  [2] un suo autovalore. Se   è una coordinata di modulo massimo di un autovettore   relativo a  , allora  . In particolare esiste   tale per cui  , ovverosia   appartiene almeno ad un cerchio di Gershgorin di  .

Dimostrazione. Sia   un autovalore di   e sia   un autovettore relativo a  . Sia   l'indice di una coordinata di   con modulo massimo tra tutte le coordinate. Dal momento che   è autovettore,   non è nullo, e dunque  . Sempre perché   è un autovettore, vale l'identità  , che, applicata all' -esima coordinata, implica che:

 

Allora, manipolando la somma, otteniamo che:

 

Dividendo entrambi i membri per   (che ricordiamo essere non nullo), passando ai moduli e applicando la disuguaglianza triangolare otteniamo che:

 

dove la disuguaglianza   vale poiché     data la scelta iniziale di  . Pertanto  , da cui la tesi.

Estensione del teorema e generalizzazione agli ovali di Cassini

modifica

Dal momento che gli autovalori di   sono invarianti per similitudine, se   è una matrice diagonale invertibile, allora   ha gli stessi autovalori di  , mantenendone invariati i centri dei cerchi di Gershgorin e riscalandone soltanto il raggio. In particolare, il nuovo raggio, indicato con  , è calcolato mediante la seguente formula:

 

Pertanto, il primo teorema di Gershgorin può essere esteso al seguente risultato:

Teorema. Sia  . Allora  [3], dove   è un insieme di vettori con coordinate positive.
 
Confronto tra i cerchi di Gershgorin (in blu, verde e giallo) e gli ovali di Cassini (in rosso) relativi alla matrice  . Le croci indicano la posizione effettiva degli autovalori[1].

Il teorema può essere esteso anche abbandonando la struttura dei cerchi di Gershgorin e riducendosi a degli ovali di Cassini della forma  , secondo il seguente enunciato:

Teorema (degli ovali di Brauer)[4]. Sia   e sia   un suo autovalore. Allora   è contenuto nell'unione   di ovali di Cassini, dove   è il raggio dell' -esimo cerchio di Gershgorin di  .

Secondo teorema di Gershgorin

modifica
Teorema. Sia  . Siano   e   due famiglie di indici con   e  .
Si definiscano   e  . Se  , allora esattamente   autovalori appartengono a   (contati con molteplicità algebrica) e i restanti   appartengono a  .

Questo teorema porta con sé delle importanti implicazioni. Ad esempio, per  , si ricava immediatamente che un cerchio disgiunto da tutti gli altri deve per forza contenere un solo autovalore, che, in quanto unico, dovrà per forza essere reale (se fosse complesso non reale, allora nello stesso cerchio dovrebbe trovarsi anche il suo autovalore complesso coniugato, e dunque il cerchio conterrebbe due autovalori invece che uno solo).

Idea di dimostrazione[5]: La dimostrazione fa uso di un argomento di continuità. Sia   la matrice diagonale ottenuta prendendo la diagonale di   e ponendo   tutti gli altri termini. Si consideri la funzione   tale per cui   (ovverosia   parametrizza il cammino fatto sul segmento   che congiunge   ad  ). Chiaramente   è una funzione continua dallo spazio topologico   con l'usuale topologia euclidea allo spazio   avente la topologia indotta dall'analoga euclidea di  . Sia   l' -esimo cerchio di Gershgorin di  . Si osserva che   ha centro   indipendentemente da  , mentre il suo raggio è  , dove   è il raggio di  , il cerchio riferito ad  . Pertanto   per  . Si ricorda che gli zeri di un polinomio dipendono continuamente dai coefficienti, e che gli autovalori di   sono gli zeri del polinomio caratteristico di  , i cui coefficienti dipendono continuamente dai termini di  , e dunque da  . Pertanto, poiché anche   è continua, gli autovalori di   dipendono continuamente da  . Sia   il cammino continuo di uno degli autovalori. Allora, se  ,   per ogni  ; altrimenti esisterebbe uno   per cui   per ogni   (il che violerebbe il primo teorema di Gershgorin) o varrebbe  , assurdo. Analogamente vale lo stesso per  . Pertanto   contiene lo stesso numero di autovalori di  , e quindi   autovalori. Analogamente   ne contiene  , da cui la tesi.

Terzo teorema di Gershgorin

modifica
Teorema. Sia   un autovalore di una matrice   irriducibile per permutazioni. Se vale l'implicazione  , allora    , e dunque  .

Dimostrazione. Sia   tale per cui  . Ripercorrendo la stessa dimostrazione del primo teorema di Gershgorin si ottiene che:

 

Dal momento che   appartiene alla frontiera  , allora il primo e l'ultimo membro devono essere uguali, e così tutte le disuguaglianze si rivelano essere uguaglianze. Affinché ciò accada, è necessario che valga   per tutti gli indici   per cui  ; ciò implica che per tutti questi indici   anche   è una coordinata di modulo massimo per  : per il primo teorema di Gershgorin, allora   per tali  .

Poiché   è irriducibile per permutazioni, il grafo associato ad   è fortemente connesso, e dunque deve esistere una sequenza di cammini di indici (eventualmente ripetuti)  ,  , ...,   con   tale per cui appaiano in essa tutti i numeri da   a  . Dacché esiste dunque un arco da   a  ,  , e dunque, per il ragionamento di prima,  . Reiterando la stessa dimostrazione fino alla fine della sequenza sostituendo ad   e   gli indici successivi nella sequenza, si è mostrato dunque che   per ogni  , da cui la tesi.

  1. ^ a b È possibile ottenere una rappresentazione grafica analoga per ogni matrice   con l'ausilio di questo sito.
  2. ^   indica lo spettro di  , ossia l'insieme dei suoi autovalori.
  3. ^ Se si sceglie   come l'insieme di tutti i vettori in   con coordinate positive, si può dimostrare che l'inclusione è stretta (cfr. R. S. Varga, Geršgorin and His Circles, Springer Verlag, 2004).
  4. ^ R. S. Varga, Geršgorin and His Circles, Springer, 2004, pp. 35-36.
  5. ^ D. Bini, M. Capovani e O. Menchi, Metodi numerici per l'algebra lineare, Bologna, Zanichelli, 1988, pp. 79-80.

Bibliografia

modifica
  • D. Bini, M. Capovani, O. Menchi, Metodi numerici per l'algebra lineare, Zanichelli, Bologna, 1988.
  • R. S. Varga, Geršgorin and His Circles, Springer, 2004.
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica