logo

Algoritmi di apprendimento automatico

Algoritmi di apprendimento automatico sono modelli computazionali che consentono ai computer di comprendere modelli e previsioni o esprimere giudizi basati sui dati senza la necessità di una programmazione esplicita. Questi algoritmi costituiscono il fondamento della moderna intelligenza artificiale e vengono utilizzati in un'ampia gamma di applicazioni, tra cui il riconoscimento di immagini e parlato, l'elaborazione del linguaggio naturale, i sistemi di raccomandazione, il rilevamento delle frodi, le automobili autonome, ecc.



Questo Algoritmi di apprendimento automatico l'articolo coprirà tutti gli algoritmi essenziali dell'apprendimento automatico come Supporta macchine vettoriali, processo decisionale, regressione logistica, classificatore naive bayees, foresta casuale, clustering k-mean, apprendimento per rinforzo, vettore, clustering gerarchico, xgboost, adaboost, logistica, ecc.

Tipi di algoritmi di machine learning

Esistono tre tipi di algoritmi di apprendimento automatico.

  1. Apprendimento supervisionato
    • Regressione
    • Classificazione
  2. Apprendimento non supervisionato
  3. Insegnamento rafforzativo

Tipi di algoritmi di machine learning



1. Algoritmo di apprendimento supervisionato

Apprendimento supervisionato è un tipo di algoritmi di apprendimento automatico in cui abbiamo utilizzato set di dati etichettati per addestrare il modello o gli algoritmi. L'obiettivo dell'algoritmo è apprendere una mappatura dai dati di input alle etichette di output, consentendogli di fare previsioni o classificazioni su dati nuovi e invisibili.

stringa di int

Algoritmi di machine learning supervisionati

  1. Modello lineare:
    • Regressione
      • Regressione ordinaria dei minimi quadrati
      • Regressione lineare semplice
      • Regressione lineare multipla
      • Regressione polinomiale
      • Inseguimento di abbinamento ortogonale (OMP)
      • Regressione bayesiana
      • Regressione quantilica
      • Regressione isotonica
      • Regressione graduale
      • Regressione all'angolo minimo (LARS)
    • Classificazione:
    • Regolarizzazione :
      • Lazo (regolarizzazione L1)
      • Ridge (regolarizzazione L2)
        • Regressione della cresta
        • Classificatore di cresta
      • Rete elastica
      • LARS Lazo
  2. K-Vicini più vicini (KNN):
    • Algoritmi di forza bruta
    • Algoritmi Ball Tree e KD Tree
    • Classificatore K-Vicini più vicini (KNN).
    • K-Regressore dei vicini più vicini (KNN).
  3. Supporta macchine vettoriali:
    • Supporta il regressore di macchine vettoriali
    • Diverse funzioni del kernel in SVM
  4. Discesa del gradiente stocastico
    • Classificatore di discesa del gradiente stocastico
    • Regressore di discesa del gradiente stocastico
    • Diverse funzioni di perdita in SGD
  5. Albero decisionale:
    • Algoritmi dell'albero decisionale
      • Algoritmi iterativi del dicotomizzatore 3 (ID3).
      • C5. Algoritmi
      • Algoritmi di classificazione e alberi di regressione
    • Classificatore dell'albero decisionale
    • Regressore dell'albero decisionale
  6. Apprendimento d'insieme:
    • Bagging (aggregazione bootstrap)
    • Potenziamento
      • AdaBoost
      • XGBoost
      • CatBoost
      • Macchine per l'incremento del gradiente (GBM)
      • LightGBM
    • Impilamento
  7. Modello generativo
    • L'ingenuo Bayes
      • Bayes naive gaussiano
      • Bayes ingenuo multinomiale
      • Bernoulli Naive Bayes
    • Processi gaussiani
      • Regressione del processo gaussiano (GPR)
      • Classificazione dei processi gaussiani (GPC)
    • Analisi discriminante gaussiana
      • Analisi Discriminante Lineare (LDA)
      • Analisi discriminante quadratica (QDA)
    • Reti di credenze bayesiane
    • Modelli Markov nascosti (HMM)
  8. Previsione delle serie temporali:
    • Visualizzazione e analisi delle serie temporali:
      • Componenti delle serie temporali: tendenza, stagionalità e rumore
      • Tecniche di scomposizione delle serie temporali
      • Destagionalizzazione e differenziazione
      • Autocorrelazione e funzioni di autocorrelazione parziale
      • Test Dickey-Fuller aumentato
      • Scomposizione stagionale delle serie temporali (scomposizione STL)
      • Metodologia Box-Jenkins per i modelli ARIMA
    • Algoritmi di previsione delle serie temporali:
      • Media mobile (MA) e media mobile ponderata
      • Metodi di livellamento esponenziale (semplice, doppio e triplo)
      • Modelli autoregressivi (AR).
      • Modelli di media mobile (MA).
      • Modelli di media mobile integrata autoregressiva (ARIMA).
      • Scomposizione stagionale delle serie temporali di Loess (STL)
      • Modelli di media mobile integrata autoregressiva stagionale (SARIMA).
      • Modelli ARIMAX e SARIMAX
  9. Tecnica di riduzione dimensionale supervisionata:
    • Analisi Discriminante Lineare (LDA)

Alcuni degli algoritmi di machine learning supervisionati possono essere utilizzati sia per la classificazione che per la regressione con qualche modifica



  • Algoritmi multiclasse e multioutput:
    • Classificazione multiclasse
      • Classificatore OneVsRest
    • Classificazione multietichetta
    • Regressione multiuscita

Metriche per algoritmi di classificazione e regressione:

  • Metriche di regressione:
    • Errore quadratico medio (MSE)
    • Errore quadratico medio (RMSE)
    • Errore assoluto medio (MAE)
    • R-quadrato
    • R quadrato corretto
  • Metriche di classificazione:
  • Calibrazione delle probabilità
    • Curve di calibrazione
    • Calibrazione di un classificatore

Tecnica di convalida incrociata:

  • Convalida incrociata K-fold
  • Convalida incrociata k-Fold stratificata
  • Lascia una validazione incrociata
  • Convalida incrociata divisa in modo casuale
  • Convalida incrociata di serie temporali

Tecnica di ottimizzazione:

  • Discesa gradiente
    • Discesa del gradiente stocastico
    • Discesa gradiente mini-batch
    • Discesa graduale basata sulla quantità di moto
  • Tecniche di ottimizzazione basate su Newton
    • L'algoritmo di Newton
    • Metodi Quasi-Newton (BFGS, L-BFGS)
    • Gradiente coniugato
  • Tecniche di ottimizzazione della ricerca locale
    • Arrampicata in collina
    • Ricerca Tabù

2. Algoritmo di apprendimento non supervisionato

Apprendimento non supervisionato è un tipo di algoritmi di apprendimento automatico in cui gli algoritmi vengono utilizzati per trovare modelli, strutture o relazioni all'interno di un set di dati utilizzando un set di dati senza etichetta. Esplora la struttura intrinseca dei dati senza categorie o etichette predefinite.

Algoritmi di machine learning non supervisionati

  • Raggruppamento
    • Metodi basati sul centroide
    • Metodi basati sulla distribuzione
    • Metodi basati sulla connettività
      • Clustering gerarchico
        • Clustering agglomerativo
        • Raggruppamento divisivo
      • Propagazione dell'affinità
    • Metodi basati sulla densità
      • DBSCAN (Clustering spaziale basato sulla densità di applicazioni con rumore)
      • OTTICA (punti di ordinamento per identificare la struttura di clustering)
  • Estrazione delle regole di associazione
    • Algoritmo Apriori
    • Crescita FP (crescita modello frequente)
    • ECLAT (Clustering di classi di equivalenza e attraversamento del reticolo dal basso verso l'alto)
  • Rilevamento anomalie:
    • Punteggio Z
    • Fattore anomalo locale (LOF)
    • Foresta di isolamento
  • Tecnica di riduzione della dimensionalità:
    • Analisi delle componenti principali (PCA)
    • Incorporamento del vicino stocastico distribuito t (t-SNE)
    • Fattorizzazione di matrice non negativa (NMF)
    • Analisi dei componenti indipendenti (ICA)
    • Analisi fattoriale
    • Allocazione Dirichlet latente (LDA)
    • Isomap
    • Incorporamento lineare locale (LLE)
    • Analisi Semantica Latente (LSA)

3. Apprendimento per rinforzo

Insegnamento rafforzativo è un tipo di algoritmi di apprendimento automatico in cui un agente impara a prendere decisioni successive interagendo con l'ambiente circostante. L'agente riceve il feedback sotto forma di incentivi o punizioni in base alle sue azioni. Lo scopo dell’agente è scoprire tattiche ottimali che massimizzino i premi cumulativi nel tempo attraverso prove ed errori. L'apprendimento per rinforzo viene spesso impiegato in scenari in cui l'agente deve imparare a muoversi in un ambiente, giocare, gestire robot o esprimere giudizi in situazioni incerte.

è in Python

Insegnamento rafforzativo

  • Metodi basati su modelli:
    • Processi decisionali di Markov (MDP)
    • Equazione di Bellman
    • Algoritmo di iterazione del valore
    • Ricerca dell'albero di Monte Carlo
  • Metodi senza modello:
    • Metodi basati sul valore:
      • Q-Learning
      • SALSA
      • Metodi Monte Carlo
    • Metodi basati sulle politiche:
      • RINFORZARE l'algoritmo
      • Algoritmo attore-critico
    • Metodi attore-critico
      • Vantaggio asincrono attore-critico (A3C)

Elenco dei più diffusi algoritmi di machine learning

Ecco un elenco dei 10 algoritmi di machine learning più popolari.

1. Regressione lineare

La regressione lineare è un semplice algoritmo utilizzato per mappare la relazione lineare tra le caratteristiche di input e una variabile target continua. Funziona adattando una linea ai dati e quindi utilizzando la linea per prevedere nuovi valori.

2. Regressione logistica

La regressione logistica è un'estensione della regressione lineare utilizzata per le attività di classificazione per stimare la probabilità che un'istanza appartenga a una classe specifica.

alfabeto e numeri

3. SVM (Macchina vettoriale di supporto)

Gli SVM sono algoritmi di apprendimento supervisionato in grado di eseguire attività di classificazione e regressione. Trova un iperpiano che separa al meglio le classi nello spazio delle caratteristiche.

4. KNN (vicino più vicino K)

KNN è una tecnica non parametrica che può essere utilizzata sia per la classificazione che per la regressione. Funziona identificando i k punti dati più simili a un nuovo punto dati e quindi prevedendo l'etichetta del nuovo punto dati utilizzando le etichette di tali punti dati.

5. Albero decisionale

Gli alberi decisionali sono un tipo di tecnica di apprendimento supervisionato che può essere utilizzata sia per la classificazione che per la regressione. Funziona segmentando i dati in gruppi sempre più piccoli fino a quando ciascun gruppo può essere classificato o previsto con un elevato grado di precisione.

6. Foresta casuale

Le foreste casuali sono un tipo di metodo di apprendimento d'insieme che utilizza una serie di alberi decisionali per effettuare previsioni aggregando previsioni da singoli alberi. Migliora la precisione e la resilienza dei singoli alberi decisionali. Può essere utilizzato sia per attività di classificazione che di regressione.

7. L'ingenuo Bayes

Naive Bayes è un classificatore probabilistico basato sul teorema di Bayes utilizzato per compiti di classificazione. Funziona presupponendo che le caratteristiche di un punto dati siano indipendenti l'una dall'altra.

8. PCA (analisi delle componenti principali)

La PCA è una tecnica di riduzione della dimensionalità utilizzata per trasformare i dati in uno spazio a dimensione inferiore mantenendo la massima varianza possibile. Funziona trovando le direzioni nei dati che contengono la maggior variazione e quindi proiettando i dati in quelle direzioni.

9. Algoritmi Apriori

L'algoritmo Apriori è una tecnica di data mining tradizionale per l'estrazione di regole di associazione in database o set di dati transazionali. È progettato per scoprire collegamenti e modelli tra cose che si verificano regolarmente nelle transazioni. Apriori rileva set di elementi frequenti, ovvero gruppi di elementi che compaiono insieme nelle transazioni con un determinato livello di supporto minimo.

10. Clustering delle K-medie

Il clustering K-Means è un approccio di apprendimento non supervisionato che può essere utilizzato per raggruppare insieme punti dati. Funziona trovando k cluster nei dati in modo che i punti dati in ciascun cluster siano il più simili possibile tra loro pur rimanendo il più distinti possibile dai punti dati in altri cluster.

matematica discreta con negazione

Scopri i concetti fondamentali che guidano il machine learning apprendendo il i 10 migliori algoritmi , come la regressione lineare, gli alberi decisionali e le reti neurali.

Algoritmo di machine learning – Domande frequenti

1. Cos'è un algoritmo nel Machine Learning?

Algoritmi di apprendimento automatico sono tecniche basate su concetti statistici che consentono ai computer di apprendere dai dati, scoprire modelli, fare previsioni o completare attività senza la necessità di una programmazione esplicita. Questi algoritmi sono generalmente classificati in tre tipi, ovvero apprendimento supervisionato, apprendimento non supervisionato e apprendimento per rinforzo.

2. Quali sono i tipi di Machine Learning?

Esistono principalmente tre tipi di machine learning:

  • Algoritmo supervisionato
  • Algoritmo non supervisionato
  • Algoritmo di rinforzo

3. Quale algoritmo ML è il migliore per la previsione?

Il metodo di machine learning ideale per la previsione è determinato da a numero di criteri , inclusa la natura del problema, il tipo di dati e i requisiti specifici. Gli approcci Support Vector Machines, Random Forests e Gradient Boosting sono popolari per i carichi di lavoro di previsione. La selezione di un algoritmo, d’altro canto, dovrebbe basarsi sul test e sulla valutazione del problema specifico e del set di dati in questione.

4. Quali‌ ‌sono‌ ‌i‌ ‌10 ‌popolari‌ ‌machine‌ ‌algoritmi di apprendimento?‌

Di seguito è riportato l'elenco dei 10 algoritmi di Machine Learning (ML) più comunemente utilizzati:

  1. Regressione lineare
  2. Regressione logistica
  3. SVM (Macchina vettoriale di supporto)
  4. KNN (K-vicino più vicino)
  5. Albero decisionale
  6. Foresta casuale
  7. L'ingenuo Bayes
  8. PCA (analisi delle componenti principali)
  9. Algoritmi Apriori
  10. K-significa clustering