logo

Varianza

Varianza è un valore di misurazione utilizzato per scoprire come vengono distribuiti i dati riguardo alla media o al valore medio del set di dati. Viene utilizzato per scoprire come sono distribuiti i dati di distribuzione relativi alla media o al valore medio. Il simbolo utilizzato per definire la varianza è σ2. È il quadrato della deviazione standard.

Ci sono due tipi di varianza utilizzati nelle statistiche,



  • Varianza di campionamento
  • Varianza della popolazione

La varianza della popolazione viene utilizzata per determinare in che modo ciascun punto dati in una particolare popolazione fluttua o viene distribuito, mentre la varianza del campione viene utilizzata per trovare la media delle deviazioni quadrate dalla media.

In questo articolo impareremo a conoscere Varianza (campione, popolazione), relative formule, proprietà e altro in dettaglio.

Tabella dei contenuti



Cos'è la varianza?

Misuriamo i vari valori dei dati e questi valori vengono utilizzati per vari scopi. I dati possono essere forniti in due tipi: dati raggruppati o dati non raggruppati (discreti). Se i dati vengono forniti sotto forma di intervalli di classi, vengono chiamati dati raggruppati, mentre se i dati vengono forniti sotto forma di un singolo punto dati vengono definiti punti dati discreti o non raggruppati. La varianza è la misura della dispersione dei dati rispetto al valore medio dei dati. Ci dice come i dati sono dispersi nel valore dei dati fornito. Possiamo facilmente calcolare la varianza del campione e la varianza della popolazione sia per i dati raggruppati che per quelli non raggruppati.

Definizione della varianza

Varianza è una misura statistica che quantifica la diffusione o la dispersione di un insieme di punti dati. Indica quanto i singoli punti dati in un set di dati differiscono dalla media del set di dati

Tipi di varianza

Possiamo definire la varianza dei dati forniti in due tipi,



  • Varianza della popolazione
  • Varianza di campionamento

Ora impariamo a conoscerli in dettaglio.

Varianza della popolazione

La varianza della popolazione viene utilizzata per trovare la diffusione della popolazione data. La popolazione è definita come un gruppo di persone e tutte le persone di quel gruppo fanno parte della popolazione. Ci dice come varia la popolazione di un gruppo rispetto alla popolazione media.

Tutti i membri di un gruppo sono conosciuti come popolazione. Quando vogliamo scoprire come varia o si distribuisce ogni punto dati in una data popolazione, utilizziamo la varianza della popolazione. Viene utilizzato per fornire la distanza quadrata di ciascun punto dati dalla media della popolazione.

Varianza di campionamento

Se i dati sulla popolazione sono molto grandi diventa difficile calcolare la varianza della popolazione del set di dati. In tal caso, prendiamo un campione di dati dal set di dati fornito e troviamo la varianza di quel set di dati che viene chiamata varianza campionaria. Durante il calcolo della media campionaria ci assicuriamo di calcolare la media campionaria, ovvero la media del set di dati campione e non la media della popolazione. Possiamo definire la varianza campionaria come la media del quadrato della differenza tra il punto dati campione e la media campionaria.

Simbolo della varianza

Il simbolo della varianza è tipicamente rappresentato dalla lettera greca sigma al quadrato (σ²) quando si fa riferimento alla varianza della popolazione. Per la varianza del campione, è spesso indicata con s².

Esempio di varianza

Possiamo comprendere il concetto di varianza con l'aiuto dell'esempio discusso di seguito.

Trova la varianza della popolazione dei dati {4,6,8,10}

Soluzione:

Media = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Varianza = (9+1+1+9)/4 = 20/4 = 5

Pertanto la varianza dei dati è 5

Formula della varianza

La varianza di un set di dati è indicata dal simbolo σ2. Per i dati sulla popolazione, la sua formula è uguale alla somma delle differenze al quadrato delle voci di dati dalla media divisa per il numero di voci. Mentre per i dati campione, dividiamo il valore del numeratore per la differenza tra il numero di voci e l'unità.

Formula della varianza campione

Se il set di dati è un campione, la formula della varianza è data da,

P 2 = ∑(x io - X) 2 /(n-1)

Dove,

  • X è la media del set di dati campione
  • N è il numero totale di osservazioni

Formula della varianza della popolazione

Se disponiamo di un set di dati sulla popolazione, la formula è scritta come:

P 2 = ∑(x io - X) 2 /N

Dove,

  • X è la media del set di dati della popolazione
  • N è il numero totale di osservazioni

Possiamo anche calcolare la varianza per set di dati raggruppati e non raggruppati. Varie formule per la varianza sono,

Multiplexer 8 a 1

Formula della varianza per dati raggruppati

Per i dati raggruppati, la formula della varianza è discussa di seguito,

Formula di varianza campione per dati raggruppati (σ 2 ) = ∑f(m io - X) 2 /(n-1)

Formula della varianza della popolazione per i dati raggruppati (P 2 ) = ∑f(m io - X) 2 /N

Dove,

  • F è la frequenza di ciascun intervallo
  • M io è il punto medio della ithintervallo
  • X è la media dei dati raggruppati

Per i dati raggruppati la media è calcolata come,

Media = ∑ (f io X io ) / ∑f io

Formula della varianza per dati non raggruppati

Per i dati non raggruppati, la formula della varianza è discussa di seguito,

  • Formula di varianza di esempio per dati non raggruppati (P 2 ) = ∑ (x io - X) 2 /(n-1)
  • Formula della varianza della popolazione per dati non raggruppati (P 2 ) = ∑ (x io - X) 2 /N

Dove X è la media dei dati raggruppati

Formula per il calcolo della varianza

La formula utilizzata per il calcolo della varianza è discussa nell'immagine seguente,

Formula della varianza

Come calcolare la varianza?

In generale, per varianza si intende la varianza standard della popolazione. La procedura per calcolare la varianza di un dato insieme di valori è:

Passo 1: Calcolare la media dell'osservazione utilizzando la formula (Media = Somma delle osservazioni/Numero di osservazioni)

Passo 2: Calcolare le differenze quadrate dei valori dei dati dalla media. (Valore dei dati – Media)2

Passaggio 3: Calcola la media delle differenze quadrate dei valori dati che sono chiamati varianza del set di dati.

(Varianza = Somma delle differenze quadrate/Numero di osservazioni)

Varianza e deviazione standard

Varianza e Deviazione standard entrambe sono misure della tendenza centrale che viene utilizzata per dirci quanto i valori del set di dati si discostano rispetto al valore centrale o medio del set di dati.

Esiste una relazione definita tra varianza e deviazione standard per ogni dato set di dati.

Varianza = (Deviazione standard) 2

La varianza è definita come il quadrato della deviazione standard, ovvero prendendo il quadrato della deviazione standard per qualsiasi gruppo di dati si ottiene la varianza di quel set di dati. la varianza è definita utilizzando il simbolo P 2 mentre P viene utilizzato per definire la deviazione standard del set di dati. La varianza del set di dati è espressa in unità quadrate mentre la deviazione standard del set di dati è espressa in un'unità simile alla media del set di dati.

Saperne di più: Varianza e deviazione standard

Varianza della distribuzione binomiale

Distribuzione binomiale è la distribuzione di probabilità discreta che ci dice il numero di risultati positivi in ​​un esperimento binomiale eseguito n numero di volte. Il risultato dell'esperimento binomiale è 0 o 1, cioè positivo o negativo.

Nell'esperimento binomiale di N prove e dove viene data la probabilità di ciascuna prova P , allora la varianza della distribuzione binomiale viene data utilizzando,

P 2 = np (1 – p)

Dove 'per esempio' è definita come la media dei valori della distribuzione binomiale.

Varianza della distribuzione di Poisson

Distribuzione del veleno è definita come una distribuzione di probabilità discreta utilizzata per definire la probabilità del numero 'n' di eventi che si verificano entro il periodo di tempo 'x'. La media nella distribuzione di Poisson è definita dal simbolo l.

Nella distribuzione di Poisson, la media e la varianza del set di dati fornito sono uguali. La varianza della distribuzione di Poisson è data utilizzando la formula,

P 2 = λ

Varianza della distribuzione uniforme

In una distribuzione uniforme, i dati della distribuzione di probabilità sono continui. Il risultato di questi esperimenti si trova nell'intervallo tra uno specifico limite superiore e uno specifico limite inferiore e quindi queste distribuzioni sono anche chiamate distribuzioni rettangolari. Se il limite superiore o il limite massimo è B e il limite inferiore o minimo è a, la varianza della distribuzione uniforme viene calcolata utilizzando la formula,

P 2 = (1/12)(b – a) 2

La media della distribuzione uniforme è data utilizzando la formula,

Media = (b + a) / 2

Dove,

  • B è il limite superiore della distribuzione uniforme
  • UN è il limite inferiore della distribuzione uniforme

Varianza e covarianza

La varianza del set di dati definisce la volatilità di tutti i valori del set di dati rispetto al valore medio del set di dati. La covarianza ci dice come le variabili casuali sono correlate tra loro e ci dice come il cambiamento in una variabile influenza il cambiamento in altre variabili.

La covarianza può essere positiva o negativa, la covarianza positiva significa che entrambe le variabili si muovono nella stessa direzione rispetto al valore medio mentre la covarianza negativa significa che entrambe le variabili si muovono in direzioni opposte rispetto al valore medio.

Per due variabili casuali x e y dove x è la variabile dipendente e y è la variabile indipendente, la covarianza viene calcolata utilizzando la formula menzionata nell'immagine allegata di seguito.

Formula di covarianza

Proprietà della varianza

La varianza è ampiamente utilizzata in matematica, statistica e altri rami della scienza per una varietà di scopi. La varianza ha varie proprietà che sono ampiamente utilizzate per risolvere vari problemi. Alcune delle proprietà di base della varianza sono,

  • La varianza del set di dati è la quantità non negativa e il valore zero della varianza indica che tutti i valori del set di dati sono uguali.
  • Un valore più alto della varianza ci dice che tutti i valori dei dati del set di dati sono ampiamente dispersi, cioè sono lontani dal valore medio del set di dati.
  • Un valore inferiore della varianza ci dice che tutti i valori dei dati del set di dati sono vicini tra loro, cioè sono molto vicini al valore medio del set di dati.

Per qualsiasi costante 'c'

  • Var(x + c) = Var(x)

Dove X è una variabile casuale

  • Var(cx) = c2

Dove X è una variabile casuale

Inoltre, se UN E B sono il valore costante e X è una variabile casuale quindi,

tipo Java di variabile
  • Var(ax + b) = a2

Per variabili indipendenti x1, X2, X3…,XNlo sappiamo,

  • Dove(x1+X2+……+xN) = Var(x1) + Dove(x2) +……..+Dove(xN)

Le persone leggono anche:

  • Significare
  • Modalità
  • Differenza tra varianza e deviazione standard

Esempi sulla formula della varianza

Esempio 1: Calcola la varianza dei dati del campione: 7, 11, 15, 19, 24.

Soluzione:

Abbiamo i dati, 7, 11, 15, 19, 24

Trova la media dei dati.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Usando la formula della varianza otteniamo,

P2= ∑(xio- X)2/(n-1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Esempio 2: calcolare il numero di osservazioni se la varianza dei dati è 12 e la somma dei quadrati delle differenze dei dati dalla media è 156.

Soluzione:

Abbiamo,

(Xio- X)2= 156

P2= 12

Usando la formula della varianza otteniamo,

P2= ∑(xio- X)2/N

12 = 156/n

n = 156/12

n = 13

Esempio 3: calcolare la varianza per i dati forniti

Xio

Fio

10 1
4 3
6 5
8 1

Soluzione:

Media (x̄) = ∑(fioXio)/∑(fio)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fio) = 1+3+5+1 = 10

Xio

Fio

FioXio

(Xio- X)

(Xio- X)2

Fio(Xio- X)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Ora,

P 2 = (∑ io N F io (X io - X) 2 /N)

= [(16 + 12 + 0 +8)/10]
= 3,6

Varianza(σ2) = 3,6

Esempio 4: trova la varianza della seguente tabella di dati

Classe

Frequenza

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Soluzione:

Classe

Xi

Fio

f×Xi

Xi – μ

(Xi – µ)2

f×(Xi –μ)2

0-10

5

3

quindici

mvc con java

-quindici

225

675

10-20

quindici

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

quindici

225

450

40-50

Quattro cinque

1

Quattro cinque

25

625

625

Totale

16

320

2000

Media (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

P 2 = (∑ io N F io (X io - M) 2 /N)

= [(2000)/(16)]
= (125)

La varianza di un dato set di dati è 125.

Riepilogo – Varianza

La varianza è una misura statistica che mostra quanto i valori in un set di dati differiscono dalla media. Ci aiuta a comprendere la diffusione o la dispersione dei punti dati. Esistono due tipi principali di varianza: la varianza della popolazione, che misura la distribuzione dei dati in un'intera popolazione, e la varianza campionaria, che misura la distribuzione dei dati in un campione. La varianza è indicata con σ² ed è il quadrato della deviazione standard. Per calcolare la varianza, trovi la media dei dati, sottrai la media da ciascun punto dati, eleva al quadrato le differenze e quindi fai la media di queste differenze al quadrato. La varianza è importante perché ci aiuta a comprendere la variabilità all'interno di un set di dati. Una varianza elevata indica che i punti dati sono ampiamente distribuiti, mentre una varianza bassa indica che sono vicini alla media. La varianza è sempre non negativa poiché comporta la quadratura delle differenze.

Domande frequenti sulla varianza

Cos'è la varianza in statistica?

La varianza è definita come la diffusione dei valori del set di dati rispetto al valore medio del set di dati. La varianza del set di dati indica la misura in cui i valori in un particolare set di dati si discostano dal valore medio.

Qual è il simbolo della varianza?

Usiamo i simboli σ2, s2 e Var(x) per denotare la varianza del set di dati.

Qual è la formula della varianza?

La varianza del set di dati viene calcolata utilizzando la formula,

P 2 = E[( X – m ) 2 ]

Cosa dice la varianza?

La varianza viene utilizzata per trovare l'entità della diffusione dei dati, ovvero ci dice come i valori in un set di dati sono distribuiti rispetto al valore medio. Per il valore maggiore della varianza, i valori sono ampiamente distribuiti rispetto al valore medio mentre per quanto riguarda il valore minore della varianza, i valori sono strettamente distribuiti rispetto al valore medio

Qual è la relazione tra varianza e deviazione standard?

Per il dato set di dati, la varianza del set di dati è il quadrato della deviazione standard di quel set di dati. Questa relazione è espressa come,

Varianza = (Deviazione standard) 2

Come si calcola la varianza?

Per calcolare la varianza, devi prima trovare la media (media) del set di dati. Quindi, sottrai la media da ciascun punto dati ed eleva il risultato al quadrato. Infine, media queste differenze quadrate.

Perché la varianza è importante?

La varianza è fondamentale per comprendere la distribuzione dei dati all'interno di un set di dati. Aiuta a determinare la distanza dei punti dati dal valore medio, indicando la variabilità o la coerenza all'interno dei dati.

Qual è la differenza tra varianza e deviazione standard?

Mentre sia la varianza che la deviazione standard misurano la dispersione dei dati, la deviazione standard è la radice quadrata della varianza. La deviazione standard è espressa nelle stesse unità dei dati, rendendola più interpretabile per indicare lo spread.

La varianza può essere negativa?

No, la varianza non può essere negativa. Poiché viene calcolato come media delle differenze al quadrato dalla media, il valore risultante è sempre non negativo.