Metodo dei moltiplicatori di Lagrange: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m stile
m stile
Riga 2:
{{doppia immagine|destra|LagrangeMultipliers3D.png|250|LagrangeMultipliers2D.svg|250|Ricerca dei massimi di <math>f(x,y)</math> dato il vincolo (rappresentato in rosso) <math>g(x,y)=c</math>.|Rappresentazione mediante curve di livello del problema. Le linee blu rappresentano curve di livello di <math>f(x,y)</math>. La soluzione al problema è data dai punti di tangenza tra la linea rossa e le linee blu.}}
 
In [[analisi matematica]] e [[programmazione matematica]], il '''metodo dei moltiplicatori di [[Joseph Louis Lagrange|Lagrange]]''' permette di ridurre i [[punto stazionario|punti stazionari]] di una funzione in ''I'' variabili e ''J'' vincoli di [[frontiera (topologia)|frontiera]] <math>\vec g(\vec x)= \vec 0</math>, detta obiettivo, a quelli di una terza funzione in ''I+J'' variabili non vincolata, detta '''lagrangiana''':
 
<math> \Lambda(\vec x, \vec \lambda) = f(\vec x) + \vec \lambda \cdot \, \vec g(\vec x) = f(\vec x) + \sum_{j=1}^J \lambda_j g_j(\vec x)</math>,
Riga 37:
:<math> \Lambda \left( x , y \right) = f \left( x , y \right) + \lambda g \left( x , y \right)</math>
 
nel modo tradizionale. Cioè, <math>\Lambda (x,y,\lambda) = f(x,y) </math> per ogni punto che soddisfa il vincolo perché <math>g(x,y)</math> è uguale a zero sul vincolo, ma i punti stazionari della <math> \Lambda (x,y,\lambda) </math> sono tutti su <math>g(x,y)=0</math>. (Come puòsi esserepuò vistovedere ponendo il gradiente uguale a zero.)
 
=== Attenzione: differenzeDifferenze tra massimi e minimi e punti stazionari ===
BisognaDa essere consapevoli del fattonotare che le soluzioni sono ''[[punto stazionario|punti stazionari]]'' della lagrangiana <math>\Lambda</math>, e questi possono essere anche [[punto di sella|punti di sella]]: questi non sono né massimi né minimi di <math>\Lambda</math> o ''F''. <math>\Lambda</math> è illimitata: dato un punto ''(x,y)'' che non giace sul vincolo, facendo il limite per <math>\lambda \to \pm \infty</math> si rende <math>\Lambda</math> arbitrariamente grande o piccola.
 
== Spiegazione analitica ==
Riga 48:
:<math>\Lambda(\mathbf x, \boldsymbol \lambda) = f + \sum_j \lambda_j g_j.</math>
 
Si osservi che siaSia il criterio di ottimizzazione sia i vincoli ''g''<sub>''j''</sub> sono compresi in modo compatto come punti stazionari della lagrangiana:
 
:<math>\nabla_{\mathbf x} \Lambda = 0 \Leftrightarrow \nabla_{\mathbf x} f = - \sum_j \lambda_j \nabla_{\mathbf x} g_j,</math>
Riga 56:
:<math>\nabla_{\mathbf \lambda} \Lambda = 0 \Rightarrow \vec g = \vec 0.</math>
 
Perciò è assolutamente '''inutile''' eseguire queste derivate all'atto pratico (se non al limite al fine di verifica dell'esattezza della lagrangiana). Spesso i moltiplicatori di Lagrange hanno un'interpretazione come una certa quantità interessante. PerSi vedereosservi perchéad ciò può capitare, si osserviesempio che:
 
:<math>\frac{\partial \Lambda}{\partial {g_j}} = \lambda_j.</math>
 
Dunque, ''λ''<sub>''j''</sub> è la velocità con cui cambia la quantità da ottimizzare come funzione della variabile vincolata.
Come esempi, nella [[meccanica lagrangiana]] le equazioni del moto sono ottenute trovando i punti stazionari dell'[[azione (fisica)|azione]], l'integrale nel tempo della differenza tra energia cinetica e potenziale. Dunque, la forza su una particella dovuta a un potenziale scalare, '''F''' = −∇''V'', può essere interpretata come un moltiplicatore di Lagrange che determina il cambiamento dell'azione (trasferimento di energia potenziale in energia cinetica) conseguente a una variazione della traiettoria vincolata della particella. In economia, il profitto ottimale per un giocatore è calcolato in base a uno spazio di azione vincolato, dove un moltiplicatore di Lagrange indica il rilassamento di un dato vincolo (ad esempio attraverso la corruzione o altri mezzi).
 
Il metodo dei moltiplicatori di Lagrange è generalizzato dalle [[condizioni di Karush-Kuhn-Tucker]].
 
== EsempioEsempi ==
=== Esempio 1 ===
[[File:Lagrange very simple.svg|thumb|upright=1.4|Figura 3. Illustrazione del problema di ottimizzazione vincolata.]]
Riga 72:
<math>(\sqrt{2}/2,\sqrt{2}/2)</math> (e il minimo viene raggiunto in <math>(-\sqrt{2}/2,-\sqrt{2}/2)</math>)
 
Analiticamente, se poniamoponendo <math>g(x,y)=x^2+y^2-1</math>, e
:<math>\Lambda(x, y, \lambda) = f(x,y) + \lambda g(x,y) = x+y + \lambda (x^2 + y^2 - 1)</math>
 
Annullando il gradiente otteniamosi ottiene il sistema di equazioni:
 
:<math>\begin{align}
Riga 82:
\frac{\partial \Lambda}{\partial \lambda} &= x^2 + y^2 - 1 &&= 0, \qquad \text{(iii)}
\end{align}</math>
 
La derivata rispetto al moltiplicatore è come sempre il vincolo originario: risulta come già detto inutile e anzi ritardante per la soluzione il suo calcolo.
 
Combinando le prime due equazioni si ottiene:
Line 95 ⟶ 96:
dunque il massimo è <math>\sqrt{2}</math>, raggiunto nel punto <math>(\sqrt{2}/2,\sqrt{2}/2)</math>, e il minimo è <math>-\sqrt{2}</math>, raggiunto nel punto <math>(-\sqrt{2}/2,-\sqrt{2}/2)</math>.
 
N.B. Secondo il [[Teorema di Weierstrass]]: Essendo x+y una funzione continua definita sul vincolo che è un insieme chiuso e limitato, essa ammette sicuramente un minimo e un massimo assoluti. Nessuno dei due punti stazionari trovati può quindi essere un punto di sella.
 
=== Esempio 2 ===
Line 106 ⟶ 107:
:<math> x^2 - y^2 - 3=0\, </math>
 
UseremoSarà perciò necessario un solo moltiplicatore λ. Annullando il gradiente della lagrangiana risultano oltre all'equazione vincolare:
 
:<math>\begin{align}
Line 113 ⟶ 114:
\end{align}</math>
 
La (i) implica λ = −''y'' ''oppure'' <math>x=0</math>. Se <math>x=0</math> allora per la vincolare dobbiamo avere il [[numero immaginario]] <math>y = \pm \sqrt{3} i</math> e dalla (ii) otteniamosi ottiene che λ=0.
Se invece λ = −''y'', sostituendo nella (ii) abbiamosi ha che,
 
:<math>x^2 + 2y^2 = 0. \, </math>
 
Quindi ''x''² = - 2''y''². Sostituendo nella vincolare e risolvendo rispetto a ''y'' si ottiene per ''y'' il valore seguente:
 
:<math>y = \pm i. \, </math>
Line 126 ⟶ 127:
:<math> (\sqrt{2},i); \quad (-\sqrt{2},i); \quad (\sqrt{2},-i); \quad (-\sqrt{2},-i); \quad (0,\sqrt{3} i); \quad (0,-\sqrt{3} i). </math>
 
Valutando l'obiettivo in questi punti, troviamosi trova
 
:<math> f(\pm\sqrt{2},i) = 2i; \quad f(\pm\sqrt{2},-i) = -2i; \quad f(0,\pm \sqrt{3} i)=0. </math>
Line 146 ⟶ 147:
:<math>-\sum_{n=1}^N p_n\log_2 p_n.</math>
 
Chiaramente il nostroIl vincolo è che le configurazioni n siano le uniche alternative possibili, cioè che la loro somma sia unitaria. La funzione di vincolo è allora:
 
:<math>\sum_{n=1}^N p_n - 1</math>
 
Per tutti gli ''n'' da 1 a ''N'', imponiamosi perciòimpongono le equazioni:
 
:<math>\frac{\partial}{\partial p_n}(-\sum_{n=1}^N p_n\log_2 p_n + \lambda \sum_{n=1}^N p_n - \lambda)=0</math>
Line 180 ⟶ 181:
</math>
 
* ProcedereSi procede con il calcolo del carattere della matrice hessiana orlata.
 
== Note ==