logo

Matrice di covarianza

La matrice di covarianza è un tipo di matrice utilizzata per descrivere i valori di covarianza tra due elementi in un vettore casuale. È nota anche come matrice varianza-covarianza perché la varianza di ciascun elemento è rappresentata lungo la diagonale maggiore della matrice e la covarianza è rappresentata tra gli elementi non diagonali. Una matrice di covarianza è solitamente una matrice quadrata. È anche semidefinito positivo e simmetrico. Questa matrice è utile quando si tratta di modellazione stocastica e analisi delle componenti principali.

Cos'è la matrice di covarianza?

IL varianza -la matrice di covarianza è a matrice quadrata con elementi diagonali che rappresentano la varianza e componenti non diagonali che esprimono la covarianza. La covarianza di una variabile può assumere qualsiasi valore reale: positivo, negativo o zero. Una covarianza positiva suggerisce che le due variabili hanno una relazione positiva, mentre una covarianza negativa indica che non è così. Se due elementi non variano insieme, hanno covarianza nulla.



Saperne di più, Matrice diagonale

Esempio di matrice di covarianza

Diciamo che ci sono 2 set di dati X = [10, 5] e Y = [3, 9]. La varianza dell'insieme X = 12,5 e la varianza dell'insieme Y = 18. La covarianza tra entrambe le variabili è -15. La matrice di covarianza è la seguente:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Formula della matrice di covarianza

La forma generale di una matrice di covarianza è data come segue:

Matrice di covarianza

arraylist nell'ordinamento Java

Dove,

  • Varianza di campionamento: dove (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Esempio di Covarinace: il (x1, E1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Varianza della popolazione: dove (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Covarianza della popolazione: il (xN, EN) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Qui, M è la media della popolazione

overline x è la media del campione

N è il numero di osservazioni

X io è l'osservazione nel set di dati x

Vediamo il formato della Matrice di Covarianza di 2 ⨯ 2 e 3 ⨯ 3

2 2 Matrice di covarianza

Sappiamo che in un 2 ⨯ 2 matrice ci sono due righe e due colonne. Quindi, la matrice di covarianza 2 ⨯ 2 può essere espressa comeegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 3 Matrice di covarianza

In una matrice 3⨯3 ci sono 3 righe e 3 colonne. Sappiamo che in una matrice di covarianza gli elementi diagonali sono varianza e gli elementi non diagonali sono covarianza. Quindi, una matrice di covarianza 3⨯3 può essere data comeegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Come trovare la matrice di covarianza?

Le dimensioni di una matrice di covarianza sono determinate dal numero di variabili in un dato set di dati. Se in un insieme ci fossero solo due variabili, la matrice di covarianza avrebbe due righe e due colonne. Allo stesso modo, se un set di dati ha tre variabili, la sua matrice di covarianza avrà tre righe e tre colonne.

I dati si riferiscono ai voti ottenuti da Anna, Caroline e Laura in Psicologia e Storia. Costruisci una matrice di covarianza.

Alunno Psicologia(X) Storia(Y)
Anna 80 70
Carolina 63 venti
Laura 100 cinquanta

È necessario seguire i seguenti passaggi:

Passo 1: Trova la media della variabile X. Somma tutte le osservazioni nella variabile X e dividi la somma ottenuta per il numero di termini. Pertanto, (80 + 63 + 100)/3 = 81.

Passo 2: Sottrai la media da tutte le osservazioni. (80 – 81), (63 – 81), (100 – 81).

Passaggio 3: Prendi i quadrati delle differenze ottenute sopra e poi sommale. Pertanto, (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

Passaggio 4: Trova la varianza di X dividendo il valore ottenuto nel passaggio 3 per 1 in meno rispetto al numero totale di osservazioni. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

Passaggio 5: Allo stesso modo, ripetere i passaggi da 1 a 4 per calcolare la varianza di Y. Var(Y) = 633.

Passaggio 6: Scegli una coppia di variabili.

Passaggio 7: Sottrarre la media della prima variabile (X) da tutte le osservazioni; (80 – 81), (63 – 81), (100 – 81).

Passaggio 8: Ripetere lo stesso per la variabile Y; (70 – 47), (20 – 47), (50 – 47).

Passaggio 9: Moltiplica i termini corrispondenti: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).

javascript

Passaggio 10: Trova la covarianza sommando questi valori e dividendoli per (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

Passaggio 11: Utilizzare la formula generale della matrice di covarianza per organizzare i termini. La matrice diventa:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Proprietà della matrice di covarianza

Le proprietà della matrice di covarianza sono menzionate di seguito:

  • Una matrice di covarianza è sempre quadrata, il che implica che il numero di righe in una matrice di covarianza è sempre uguale al numero di colonne in essa contenute.
  • Una matrice di covarianza è sempre simmetrica, il che implica che trasporre di una matrice di covarianza è sempre uguale alla matrice originale.
  • Una matrice di covarianza è sempre positiva e semidefinita.
  • IL autovalori di una matrice di covarianza sono sempre reali e non negativi.

Per saperne di più,

  • Tipi di matrici
  • Moltiplicazione di matrici
  • Varianza e deviazione standard

Esempi risolti sulla matrice di covarianza

Esempio 1: Di seguito sono riportati i voti ottenuti da 3 studenti in Fisica e Biologia:

AlunnoFisica(X)Biologia(Y)
UN 92 80
B 60 30
C 100 70

Calcola la matrice di covarianza dai dati sopra.

Soluzione:

La matrice di covarianza del campione è data dafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Ecco, μX= 84, n = 3

var(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448

Quindi, μE= 60, n = 3

var(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700

Ora, cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

La matrice di covarianza della popolazione è data come:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

Esempio 2. Preparare la matrice di covarianza della popolazione dalla seguente tabella:

EtàNumero di persone
29 68
26 60
30 58
35 40

Soluzione:

La varianza della popolazione è data dafrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Ecco, μX= 56,5, n = 4

var(x) = [(68 – 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2] / 4 = 104,75

Quindi, μE= 30, n = 4

var(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2] / 4 = 10,5

Ora, cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

La matrice di covarianza della popolazione è data come: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Esempio 3. Interpretare la seguente matrice di covarianza:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

Soluzione:

  1. Gli elementi diagonali 60, 30 e 80 indicano rispettivamente la varianza negli insiemi di dati X, Y e Z. Y mostra la varianza più bassa mentre Z mostra la varianza più alta.
  2. La covarianza per X e Y è 32. Poiché si tratta di un numero positivo, significa che quando X aumenta (o diminuisce) anche Y aumenta (o diminuisce)
  3. La covarianza per X e Z è -4. Essendo un numero negativo implica che quando X aumenta Z diminuisce e viceversa.
  4. La covarianza per Y e Z è 0. Ciò significa che non esiste una relazione prevedibile tra i due set di dati.

Esempio 4. Trova la matrice di covarianza del campione per i seguenti dati:

XECON
75 10.5 Quattro cinque
65 12.8 65
22 7.3 74
quindici 2.1 76
18 9.2 56

Soluzione:

La matrice di covarianza del campione è data dafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, mX= 22,4, var(X) = 321,2 / (5 – 1) = 80,3

ME= 12,58, var(Y) = 132,148 / 4 = 33,037

MCon= 64, var(Z) = 570 / 4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

La matrice di covarianza è data come:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Domande frequenti sulla matrice di covarianza

1. Definire la matrice di covarianza

Una matrice di covarianza è un tipo di matrice utilizzata per descrivere i valori di covarianza tra due elementi in un vettore casuale.

2. Qual è la formula per la matrice di covarianza?

La formula per la matrice di covarianza è data come

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

Dove, Varianza di campionamento: dove (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Esempio di Covarinace: il (x1, E1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Varianza della popolazione: dove (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Covarianza della popolazione: il (xN, EN) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Qual è la forma generale di una matrice di covarianza 3 ⨯ 3?

La forma generale di una matrice di covarianza 3 ⨯ 3 è data come segue:

funzione freccia dattiloscritta

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Quali sono le proprietà della matrice di covarianza?

La matrice di covarianza è una matrice quadrata ed è anche di natura simmetrica, ovvero la trasposizione della matrice originale dà la matrice originale stessa

5. Quali sono i settori in cui è possibile utilizzare la Matrice di Covarianza?

La matrice di covarianza viene utilizzata nel campo della matematica, dell'apprendimento automatico, della finanza e dell'economia. La matrice di covarianza viene utilizzata nella decomposizione di Cholskey per eseguire la simulazione Monte Carlo utilizzata per creare modelli matematici.