In questo articolo impareremo come utilizzare la funzione lm() per adattare modelli lineari nel linguaggio di programmazione R.
Un modello lineare viene utilizzato per prevedere il valore di una variabile sconosciuta sulla base di variabili indipendenti. Viene utilizzato principalmente per scoprire la relazione tra variabili e previsioni. La funzione lm() viene utilizzata per adattare modelli lineari ai frame di dati nel linguaggio R. Può essere utilizzato per eseguire regressione, analisi della varianza a strato singolo e analisi della covarianza per prevedere il valore corrispondente ai dati che non si trovano nel frame dati. Questi sono molto utili per prevedere il prezzo degli immobili, le previsioni del tempo, ecc.
Per adattare un modello lineare nel linguaggio R utilizzando il metodo lom() funzione, utilizziamo innanzitutto la funzione data.frame() per creare un frame di dati di esempio che contiene valori che devono essere adattati a un modello lineare utilizzando la funzione di regressione. Quindi utilizziamo la funzione lm() per adattare una determinata funzione a un dato frame di dati.
Sintassi:
lm( formula_adattamento, frame dati )
Parametro:
fitting_formula: determina la formula per il modello lineare. dataframe: determina il nome del dataframe che contiene i dati.
Quindi, possiamo utilizzare la funzione summary() per visualizzare il riepilogo del modello lineare. La funzione summary() interpreta i valori statistici più importanti per l'analisi del modello lineare.
allinea l'immagine CSS
Sintassi:
riepilogo( modello_lineare )
Il riepilogo contiene le seguenti informazioni chiave:
- Errore standard residuo: determina la deviazione standard dell'errore in cui la radice quadrata della varianza sottrae n meno 1 + # di variabili coinvolte invece di dividere per n-1. R-quadrato multiplo: determina la precisione con cui il modello si adatta ai dati. R-quadrato corretto: normalizza R-quadrato multiplo tenendo conto di quanti campioni hai e quante variabili stai utilizzando. Statistica F: è un test globale che verifica se almeno uno dei tuoi coefficienti è diverso da zero.
Esempio: Esempio per mostrare l'utilizzo della funzione lm().
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Produzione:
Chiamata:
lm(formula = y ~ x^2, dati = df)
Residui:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Coefficienti:
Stima standard Errore valore t Pr(>|t|)
(Intercetta) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. codici: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Errore standard residuo: 2.944 su 3 gradi di libertà
R quadrato multiplo: 0,9326, R quadrato corretto: 0,9102
Statistica F: 41,54 su 1 e 3 DF, valore p: 0,007575
Trame diagnostiche
I grafici diagnostici ci aiutano a visualizzare la relazione tra i diversi valori statistici del modello. Ci aiuta ad analizzare l'entità dei valori anomali e l'efficienza del modello adattato. Per visualizzare i grafici diagnostici di un modello lineare, utilizziamo la funzione plot() nel linguaggio R.
Sintassi:
trama(modello_lineare)
Esempio: Grafici diagnostici per il modello lineare adattato sopra.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Produzione:

Tracciamento del modello lineare
Possiamo tracciare il modello lineare adattato sopra per visualizzarlo bene utilizzando il metodo abline(). Per prima cosa tracciamo un grafico a dispersione di punti dati e poi lo sovrapponiamo con un grafico abline del modello lineare utilizzando la funzione abline().
Sintassi:
traccia( df$x, df$y)
come funziona un computerabline( Modello_lineare )
Esempio: Tracciamento del modello lineare
R
stringa a int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Produzione:

Prevedere i valori per punti dati sconosciuti utilizzando il modello adattato
Per prevedere i valori per nuovi input utilizzando il modello lineare adattato sopra, utilizziamo la funzione predit(). La funzione predit() prende il modello e il frame di dati con punti dati sconosciuti e prevede il valore per ciascun punto dati in base al modello adattato.
Sintassi:
predire (modello, dati)
Parametro:
modello: determina il modello lineare. dati: determina il frame di dati con punti dati sconosciuti.
Esempio: Predire nuovi input
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Produzione:
1 2 3 83 89 95>