logo

Regressione e classificazione nell'apprendimento automatico

Gli algoritmi di regressione e classificazione sono algoritmi di apprendimento supervisionato. Entrambi gli algoritmi vengono utilizzati per la previsione nell'apprendimento automatico e funzionano con i set di dati etichettati. Ma la differenza tra i due è il modo in cui vengono utilizzati per diversi problemi di machine learning.

La differenza principale tra gli algoritmi di regressione e di classificazione a cui vengono utilizzati gli algoritmi di regressione prevedere il continuo vengono utilizzati valori come prezzo, stipendio, età, ecc. e algoritmi di classificazione prevedere/classificare i valori discreti come Maschio o Femmina, Vero o Falso, Spam o Non Spam, ecc.

Considera il diagramma seguente:

Regressione vs. classificazione

Classificazione:

La classificazione è un processo per trovare una funzione che aiuta a dividere il set di dati in classi in base a diversi parametri. Nella classificazione, un programma per computer viene addestrato sul set di dati di addestramento e, in base a tale addestramento, classifica i dati in classi diverse.

Il compito dell'algoritmo di classificazione è trovare la funzione di mappatura per mappare l'input(x) sull'output discreto(y).

Esempio: L'esempio migliore per comprendere il problema della classificazione è il rilevamento dello spam nelle e-mail. Il modello viene addestrato sulla base di milioni di email su diversi parametri e ogni volta che riceve una nuova email identifica se l'email è spam o meno. Se l'e-mail è spam, viene spostata nella cartella Spam.

Tipi di algoritmi di classificazione ML:

Gli algoritmi di classificazione possono essere ulteriormente suddivisi nelle seguenti tipologie:

  • Regressione logistica
  • K-Vicini più vicini
  • Supporta macchine vettoriali
  • SVM del kernel
  • Na�ve Bayes
  • Classificazione dell'albero decisionale
  • Classificazione casuale delle foreste

Regressione:

La regressione è un processo per trovare le correlazioni tra variabili dipendenti e indipendenti. Aiuta a prevedere le variabili continue come la previsione di Trend di mercato , previsione dei prezzi delle case, ecc.

Il compito dell'algoritmo di regressione è trovare la funzione di mappatura per mappare la variabile di input (x) sulla variabile di output continua (y).

Esempio: Supponiamo di voler fare previsioni meteorologiche, quindi per questo utilizzeremo l'algoritmo di regressione. Nella previsione del tempo, il modello viene addestrato sui dati passati e, una volta completato l'addestramento, può facilmente prevedere il tempo per i giorni futuri.

Tipi di algoritmo di regressione:

puntatore di dereferenziazione
  • Regressione lineare semplice
  • Regressione lineare multipla
  • Regressione polinomiale
  • Supporta la regressione vettoriale
  • Regressione dell'albero decisionale
  • Regressione casuale della foresta

Differenza tra regressione e classificazione

Algoritmo di regressione Algoritmo di classificazione
Nella regressione, la variabile di output deve essere di natura continua o valore reale. In Classificazione, la variabile di output deve essere un valore discreto.
Il compito dell'algoritmo di regressione è mappare il valore di input (x) con la variabile di output continua (y). Il compito dell'algoritmo di classificazione è mappare il valore di input (x) con la variabile di output discreta (y).
Gli algoritmi di regressione vengono utilizzati con dati continui. Gli algoritmi di classificazione vengono utilizzati con dati discreti.
Nella regressione, proviamo a trovare la linea di adattamento migliore, che può prevedere l'output in modo più accurato. In Classificazione, proviamo a trovare il confine decisionale, che può dividere il set di dati in diverse classi.
Gli algoritmi di regressione possono essere utilizzati per risolvere problemi di regressione come la previsione del tempo, la previsione del prezzo della casa, ecc. Gli algoritmi di classificazione possono essere utilizzati per risolvere problemi di classificazione come l'identificazione di e-mail di spam, il riconoscimento vocale, l'identificazione di cellule tumorali, ecc.
L'algoritmo di regressione può essere ulteriormente suddiviso in regressione lineare e non lineare. Gli algoritmi di classificazione possono essere suddivisi in classificatore binario e classificatore multiclasse.