IL test del chi quadrato di indipendenza valuta se esiste un'associazione tra le categorie delle due variabili. Esistono fondamentalmente due tipi di variabili casuali e producono due tipi di dati: numerici e categoriali. In Linguaggio di programmazione R La statistica chi-quadrato viene utilizzata per indagare se le distribuzioni delle variabili categoriali differiscono l'una dall'altra. Il test chi quadrato è utile anche per confrontare i conteggi o i conteggi delle risposte categoriche tra due (o più) gruppi indipendenti.
Nel linguaggio di programmazione R, la funzione utilizzata per eseguire un test chi-quadrato è chisq.test()>
.
Sintassi:
chisq.test(dati)
prodotto punto intorpiditoparametri:
dati : i dati sono una tabella contenente i valori di conteggio delle variabili nella tabella.
Prenderemo i dati del sondaggio in MASS>
biblioteca che rappresenta i dati di un sondaggio condotto sugli studenti.
R
# load the MASS package> library> (MASS)> print> (> str> (survey))> |
>
>
Produzione:
'data.frame': 237 obs. of 12 variables: $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ... $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ... $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ... $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ... $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ... $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ... $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ... $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ... $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ... $ Height: num 173 178 NA 160 165 ... $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ... $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>
Il risultato sopra mostra che il set di dati ha molte variabili fattore che possono essere considerate variabili categoriali. Per il nostro modello, considereremo le variabili Eser E Fumo .La colonna Fumo registra le abitudini di fumo degli studenti mentre la colonna Esercizio registra il loro livello di esercizio. Il nostro obiettivo è verificare l'ipotesi se l'abitudine al fumo degli studenti sia indipendente dal loro livello di esercizio fisico con un livello di significatività pari a 0,05.
R
system.out.println
# Create a data frame from the main data set.> stu_data => data.frame> (survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data => table> (survey$Smoke,survey$Exer)> > print> (stu_data)> |
>
>
Produzione:
Freq None Some Heavy 7 1 3 Never 87 18 84 Occas 12 3 4 Regul 9 1 7>
E infine applichiamo il chisq.test()>
funzione alla tabella di contingenza stu_data.
R
rete neurale artificiale
# applying chisq.test() function> print> (> chisq.test> (stu_data))> |
>
>
Produzione:
Pearson's Chi-squared test data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>
Poiché il valore p 0,4828 è maggiore di 0,05, concludiamo che l'abitudine al fumo è indipendente dal livello di esercizio dello studente e quindi esiste una correlazione debole o assente tra le due variabili. Il codice R completo è riportato di seguito.
Quindi, in sintesi, si può dire che è molto semplice eseguire un test Chi-quadrato utilizzando R. È possibile eseguire questo compito utilizzando chisq.test()>
funzione in R.
aws sns
Visualizzare i dati del test Chi-Quadro
R
# Load required library> library> (MASS)> # Print structure of the survey dataset> print> (> str> (survey))> # Create a data frame for smoking and exercise columns> stu_data <-> data.frame> (survey$Smoke, survey$Exer)> stu_data <-> table> (survey$Smoke, survey$Exer)> # Print the table> print> (stu_data)> # Perform the Chi-Square Test> chi_result <-> chisq.test> (stu_data)> print> (chi_result)> # Visualize the data with a bar plot> barplot> (stu_data, beside => TRUE> , col => c> (> 'lightblue'> ,> 'lightgreen'> ),> > main => 'Smoking Habits vs Exercise Levels'> ,> > xlab => 'Exercise Level'> , ylab => 'Number of Students'> )> # Add legend separately> legend> (> 'center'> , legend => rownames> (stu_data), fill => c> (> 'lightblue'> ,> 'lightgreen'> ))> |
>
>
Produzione:

Test del chi quadrato in R
In questo codice usiamo ilMASS>
biblioteca per condurre un test Chi-Square sul set di dati del “sondaggio”, concentrandosi sulla relazione tra abitudini al fumo e livelli di esercizio fisico.
Crea una tabella di contingenza, esegue il test statistico e visualizza i dati utilizzando un grafico a barre. La legenda viene aggiunta separatamente nell'angolo in alto a sinistra, distinguendo tra diverse abitudini di fumo con colori distinti.
Il codice mira a esplorare e comunicare le associazioni tra il comportamento del fumo e le pratiche di esercizio fisico all'interno del set di dati.