In matematica, in particolare nell'ambito dell'algebra lineare e dell'analisi funzionale, per una data matrice hermitiana
e un vettore non nullo
, il quoziente di Rayleigh è il numero reale:

dove
indica il vettore trasposto coniugato di
. Anche se definito tramite quantità complesse, il quoziente di Rayleigh è sempre reale, essendo
una forma hermitiana ed essendo
, dove
indica la norma euclidea. Come verifica, è sufficiente porre
e osservare che, essendo
, si ha:

ma ciò implica che
.
Si può dimostrare che il quoziente di Rayleigh assume il valore minimo
, che è il più piccolo autovalore di
, quando
è il corrispondente autovettore
. Analogamente, si ha
e
.
L'immagine del quoziente di Rayleigh è lo spettro di
, e il numero
è il raggio spettrale.
Matrice delle covarianze
Un caso di particolare importanza si verifica quando la matrice
è la matrice delle covarianze. Un tale matrice può essere rappresentata dal prodotto
, dove
è una matrice di dati empirici e
la sua trasposta. Essendo simmetrica,
possiede autovalori non negativi e autovettori ortogonali (più precisamente, ortonormalizzabili). Infatti:




ovvero gli autovalori
non sono negativi. Inoltre:

ovvero gli autovettori
sono ortogonali (ortonormalizzabili nel caso di autovettori differenti/molteplici).
Per mostrare che il quoziente di Rayleigh è massimizzato dall'autovettore relativo al più grande autovalore (raggio spettrale), si consideri la decomposizione di un generico vettore
nella base degli autovettori
:

dove:

è la coordinata di
proiettata ortogonalmente su
. Quindi si ha:

che per la mutua perpendicolarità degli autovettori diventa:

ovvero il quoziente di Rayleigh è la somma dei coseni al quadrato degli angoli formati tra
e gli autovettori
, pesata per i rispettivi autovalori.
Se un vettore
massimizza
, allora anche ogni scalare non nullo
massimizza
e pertanto il problema può essere ridotto al metodo di Lagrange per massimizzare
, a condizione che:

Questo risultato può essere ricavato anche utilizzando il metodo dei moltiplicatori di Lagrange. Il problema consiste nel trovare i punti critici della funzione:

soggetta al vincolo
. Si tratta cioè di trovare i punti critici di:

dove
è un moltiplicatore di Lagrange. Il punto stazionario di
si verifica quando:



e:

Quindi, gli autovettori
di
sono i punti critici del quoziente di Rayleigh e i rispettivi autovalori
sono i valori stazionari di
.
Utilizzo nella teoria di Sturm-Liouville
La teoria di Sturm-Liouville studia l'azione dell'operatore lineare:
![{\displaystyle L(y)={\frac {1}{w(x)}\left(-{\frac {d}{dx}\left[p(x){\frac {dy}{dx}\right]+q(x)y\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/371147c6e1ef449ffd33e67888014e4866665d32)
sullo spazio prehilbertiano definito da:

composto da funzioni che soddisfano alcune specifiche condizioni al contorno in
e
. In tal caso il quoziente di Rayleigh è:
![{\displaystyle {\frac {\langle {y,Ly}\rangle }{\langle {y,y}\rangle }={\frac {\int _{a}^{b}y(x)\left(-{\frac {d}{dx}\left[p(x){\frac {dy}{dx}\right]+q(x)y(x)\right)dx}{\int _{a}^{b}{w(x)y(x)^{2}dx}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1b6e5eef3a2153255093df7f439ec9b0d2a4a3c2)
Talvolta è presentato in una forma equivalente, ottenuta separando l'integrale al numeratore e utilizzando l'integrazione per parti:
![{\displaystyle {\begin{aligned}{\frac {\langle {y,Ly}\rangle }{\langle {y,y}\rangle }&={\frac {\left\{\int _{a}^{b}y(x)\left(-{\frac {d}{dx}\left[p(x)y'(x)\right]\right)dx\right\}+\left\{\int _{a}^{b}{q(x)y(x)^{2}\,dx\right\}{\int _{a}^{b}{w(x)y(x)^{2}\,dx}\\&={\frac {\left\{\left.-y(x)\left[p(x)y'(x)\right]\right|_{a}^{b}\right\}+\left\{\int _{a}^{b}y'(x)\left[p(x)y'(x)\right]\,dx\right\}+\left\{\int _{a}^{b}{q(x)y(x)^{2}\,dx\right\}{\int _{a}^{b}w(x)y(x)^{2}\,dx}\\&={\frac {\left\{\left.-p(x)y(x)y'(x)\right|_{a}^{b}\right\}+\left\{\int _{a}^{b}\left[p(x)y'(x)^{2}+q(x)y(x)^{2}\right]\,dx\right\}{\int _{a}^{b}{w(x)y(x)^{2}\,dx}\end{aligned}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a809e4269a2a82ade4fc581d7ec999d869477100)
Generalizzazione
Per una data coppia di matrici
e per un dato vettore
, il quoziente di Rayleigh generalizzato è definito come:

Il quoziente di Rayleigh generalizzato può essere ridotto al quoziente di Rayleigh
attraverso la trasformazione
, dove
è la decomposizione di Cholesky della matrice hermitiana
definita positiva.
Bibliografia
- (EN) Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau, Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining, Ch. 2, Springer, 2011.
- (EN) Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.
- (EN) Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics, 1998.
Voci correlate
Collegamenti esterni