logo

Test del chi quadrato in R

IL test del chi quadrato di indipendenza valuta se esiste un'associazione tra le categorie delle due variabili. Esistono fondamentalmente due tipi di variabili casuali e producono due tipi di dati: numerici e categoriali. In Linguaggio di programmazione R La statistica chi-quadrato viene utilizzata per indagare se le distribuzioni delle variabili categoriali differiscono l'una dall'altra. Il test chi quadrato è utile anche per confrontare i conteggi o i conteggi delle risposte categoriche tra due (o più) gruppi indipendenti.

Nel linguaggio di programmazione R, la funzione utilizzata per eseguire un test chi-quadrato è chisq.test()> .



Sintassi:

chisq.test(dati)

prodotto punto intorpidito

parametri:



dati : i dati sono una tabella contenente i valori di conteggio delle variabili nella tabella.

Prenderemo i dati del sondaggio in MASS> biblioteca che rappresenta i dati di un sondaggio condotto sugli studenti.

R






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

>

Produzione:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

Il risultato sopra mostra che il set di dati ha molte variabili fattore che possono essere considerate variabili categoriali. Per il nostro modello, considereremo le variabili Eser E Fumo .La colonna Fumo registra le abitudini di fumo degli studenti mentre la colonna Esercizio registra il loro livello di esercizio. Il nostro obiettivo è verificare l'ipotesi se l'abitudine al fumo degli studenti sia indipendente dal loro livello di esercizio fisico con un livello di significatività pari a 0,05.

R


system.out.println



# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Produzione:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

E infine applichiamo il chisq.test()> funzione alla tabella di contingenza stu_data.

R




rete neurale artificiale
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Produzione:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Poiché il valore p 0,4828 è maggiore di 0,05, concludiamo che l'abitudine al fumo è indipendente dal livello di esercizio dello studente e quindi esiste una correlazione debole o assente tra le due variabili. Il codice R completo è riportato di seguito.

Quindi, in sintesi, si può dire che è molto semplice eseguire un test Chi-quadrato utilizzando R. È possibile eseguire questo compito utilizzando chisq.test()> funzione in R.

aws sns

Visualizzare i dati del test Chi-Quadro

R




# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

Produzione:

gh

Test del chi quadrato in R

In questo codice usiamo ilMASS>biblioteca per condurre un test Chi-Square sul set di dati del “sondaggio”, concentrandosi sulla relazione tra abitudini al fumo e livelli di esercizio fisico.

Crea una tabella di contingenza, esegue il test statistico e visualizza i dati utilizzando un grafico a barre. La legenda viene aggiunta separatamente nell'angolo in alto a sinistra, distinguendo tra diverse abitudini di fumo con colori distinti.

Il codice mira a esplorare e comunicare le associazioni tra il comportamento del fumo e le pratiche di esercizio fisico all'interno del set di dati.