logo

Tipi di apprendimento automatico

L'apprendimento automatico è un sottoinsieme dell'intelligenza artificiale, che consente alla macchina di apprendere automaticamente dai dati, migliorare le prestazioni dalle esperienze passate e fare previsioni . L'apprendimento automatico contiene una serie di algoritmi che funzionano su un'enorme quantità di dati. I dati vengono forniti a questi algoritmi per addestrarli e, sulla base della formazione, costruiscono il modello ed eseguono un compito specifico.

siti web di film simili a 123movies
Tipi di apprendimento automatico

Questi algoritmi ML aiutano a risolvere diversi problemi aziendali come regressione, classificazione, previsione, clustering e associazioni, ecc.

In base ai metodi e alle modalità di apprendimento, il machine learning si divide principalmente in quattro tipologie, che sono:

  1. Apprendimento automatico supervisionato
  2. Apprendimento automatico non supervisionato
  3. Apprendimento automatico semi-supervisionato
  4. Insegnamento rafforzativo
Tipi di apprendimento automatico

In questo argomento forniremo una descrizione dettagliata dei tipi di Machine Learning insieme ai rispettivi algoritmi:

1. Apprendimento automatico supervisionato

Come suggerisce il nome, Apprendimento automatico supervisionato si basa sulla supervisione. Ciò significa che nella tecnica di apprendimento supervisionato addestriamo le macchine utilizzando il set di dati 'etichettato' e, in base all'addestramento, la macchina prevede l'output. Qui, i dati etichettati specificano che alcuni degli input sono già mappati sull'output. Più preziosamente, possiamo dire; per prima cosa addestriamo la macchina con l'input e l'output corrispondente, quindi chiediamo alla macchina di prevedere l'output utilizzando il set di dati di test.

Comprendiamo l'apprendimento supervisionato con un esempio. Supponiamo di avere un set di dati di input di immagini di cani e gatti. Quindi, in primo luogo, forniremo alla macchina la formazione per comprendere le immagini, come ad esempio forma e dimensione della coda di cane e gatto, forma degli occhi, colore, altezza (i cani sono più alti, i gatti sono più piccoli), ecc. Dopo aver completato l'addestramento, inseriamo l'immagine di un gatto e chiediamo alla macchina di identificare l'oggetto e prevedere l'output. Adesso la macchina è ben addestrata, quindi controllerà tutte le caratteristiche dell'oggetto, come altezza, forma, colore, occhi, orecchie, coda, ecc., e scoprirà che è un gatto. Quindi, lo inserirà nella categoria Gatto. Questo è il processo con cui la macchina identifica gli oggetti nell'apprendimento supervisionato.

L'obiettivo principale della tecnica di apprendimento supervisionato è mappare la variabile di input (x) con la variabile di output (y). Alcune applicazioni nel mondo reale dell'apprendimento supervisionato lo sono Valutazione del rischio, rilevamento delle frodi, filtraggio dello spam, eccetera.

Categorie di machine learning supervisionato

L’apprendimento automatico supervisionato può essere classificato in due tipi di problemi, riportati di seguito:

    Classificazione Regressione

a) Classificazione

Gli algoritmi di classificazione vengono utilizzati per risolvere i problemi di classificazione in cui la variabile di output è categoriale, come ' Sì o No, Maschio o Femmina, Rosso o Blu, ecc . Gli algoritmi di classificazione prevedono le categorie presenti nel dataset. Alcuni esempi reali di algoritmi di classificazione sono Rilevamento spam, filtraggio e-mail, ecc.

Di seguito sono riportati alcuni algoritmi di classificazione popolari:

    Algoritmo della foresta casuale Algoritmo dell'albero decisionale Algoritmo di regressione logistica Supporta l'algoritmo della macchina vettoriale

b) Regressione

Gli algoritmi di regressione vengono utilizzati per risolvere problemi di regressione in cui esiste una relazione lineare tra le variabili di input e di output. Questi vengono utilizzati per prevedere variabili di output continue, come tendenze di mercato, previsioni meteorologiche, ecc.

Di seguito sono riportati alcuni algoritmi di regressione popolari:

    Algoritmo di regressione lineare semplice Algoritmo di regressione multivariata Algoritmo dell'albero decisionale Regressione al lazo

Vantaggi e svantaggi dell'apprendimento supervisionato

Vantaggi:

  • Poiché l'apprendimento supervisionato funziona con il set di dati etichettato, possiamo avere un'idea esatta delle classi di oggetti.
  • Questi algoritmi sono utili per prevedere l'output sulla base dell'esperienza precedente.

Svantaggi:

  • Questi algoritmi non sono in grado di risolvere compiti complessi.
  • Potrebbe prevedere l'output sbagliato se i dati del test sono diversi dai dati di training.
  • Richiede molto tempo di calcolo per addestrare l'algoritmo.

Applicazioni dell'apprendimento supervisionato

Di seguito sono riportate alcune applicazioni comuni dell'apprendimento supervisionato:

    Segmentazione delle immagini:
    Gli algoritmi di apprendimento supervisionato vengono utilizzati nella segmentazione delle immagini. In questo processo, la classificazione delle immagini viene eseguita su diversi dati di immagine con etichette predefinite.Diagnosi medica:
    Gli algoritmi supervisionati vengono utilizzati anche in campo medico a fini diagnostici. Viene eseguito utilizzando immagini mediche e dati precedenti etichettati con etichette per condizioni patologiche. Con tale processo, la macchina può identificare una malattia per i nuovi pazienti.Intercettazione di una frode -Gli algoritmi di classificazione dell'apprendimento supervisionato vengono utilizzati per identificare transazioni fraudolente, clienti fraudolenti, ecc. Viene effettuato utilizzando dati storici per identificare i modelli che possono portare a possibili frodi.Rilevamento spam -Nel rilevamento e nel filtraggio dello spam vengono utilizzati algoritmi di classificazione. Questi algoritmi classificano un'e-mail come spam o non spam. Le e-mail di spam vengono inviate alla cartella spam.Riconoscimento vocale -Gli algoritmi di apprendimento supervisionato vengono utilizzati anche nel riconoscimento vocale. L'algoritmo viene addestrato con dati vocali e utilizzando gli stessi è possibile eseguire varie identificazioni, come password ad attivazione vocale, comandi vocali, ecc.

2. Apprendimento automatico non supervisionato

Apprendimento non supervisionato g è diverso dalla tecnica di apprendimento supervisionato; come suggerisce il nome, non è necessaria alcuna supervisione. Ciò significa che, nell'apprendimento automatico non supervisionato, la macchina viene addestrata utilizzando il set di dati senza etichetta e la macchina prevede l'output senza alcuna supervisione.

Nell'apprendimento non supervisionato, i modelli vengono addestrati con dati che non sono né classificati né etichettati e il modello agisce su tali dati senza alcuna supervisione.

Lo scopo principale dell'algoritmo di apprendimento non supervisionato è raggruppare o classificare il set di dati non ordinato in base a somiglianze, modelli e differenze. Alle macchine viene chiesto di trovare i modelli nascosti dal set di dati di input.

Facciamo un esempio per capirlo più preziosamente; supponiamo che ci sia un cesto di immagini di frutta e lo inseriamo nel modello di apprendimento automatico. Le immagini sono totalmente sconosciute al modello e il compito della macchina è trovare i modelli e le categorie degli oggetti.

Quindi, ora la macchina ne scoprirà i modelli e le differenze, come la differenza di colore, la differenza di forma, e prevederà l'output quando verrà testato con il set di dati di test.

Categorie di machine learning non supervisionato

L’apprendimento non supervisionato può essere ulteriormente classificato in due tipologie, riportate di seguito:

    Raggruppamento Associazione

1) Raggruppamento

La tecnica del clustering viene utilizzata quando vogliamo trovare i gruppi inerenti dai dati. È un modo per raggruppare gli oggetti in un cluster in modo tale che gli oggetti con il maggior numero di somiglianze rimangano in un gruppo e abbiano meno o nessuna somiglianza con gli oggetti di altri gruppi. Un esempio dell'algoritmo di clustering è raggruppare i clienti in base al loro comportamento di acquisto.

Di seguito sono riportati alcuni degli algoritmi di clustering più diffusi:

    Algoritmo di clustering K-Means Algoritmo di spostamento della media Algoritmo DBSCAN Analisi del componente principale Analisi dei componenti indipendenti

2) Associazione

L'apprendimento delle regole di associazione è una tecnica di apprendimento non supervisionato, che trova relazioni interessanti tra le variabili all'interno di un set di dati di grandi dimensioni. Lo scopo principale di questo algoritmo di apprendimento è trovare la dipendenza di un dato da un altro e mappare tali variabili di conseguenza in modo che possa generare il massimo profitto. Questo algoritmo viene applicato principalmente in Analisi del paniere di mercato, mining dell'utilizzo del Web, produzione continua , eccetera.

Alcuni algoritmi popolari di apprendimento delle regole di associazione sono Algoritmo Apriori, Eclat, algoritmo di crescita FP.

Vantaggi e svantaggi dell'algoritmo di apprendimento non supervisionato

Vantaggi:

  • Questi algoritmi possono essere utilizzati per compiti complicati rispetto a quelli supervisionati perché funzionano sul set di dati senza etichetta.
  • Gli algoritmi non supervisionati sono preferibili per varie attività poiché ottenere il set di dati senza etichetta è più semplice rispetto al set di dati con etichetta.

Svantaggi:

  • L'output di un algoritmo non supervisionato può essere meno accurato poiché il set di dati non è etichettato e gli algoritmi non vengono addestrati in precedenza con l'output esatto.
  • Lavorare con l'apprendimento non supervisionato è più difficile poiché funziona con il set di dati senza etichetta che non è mappato con l'output.

Applicazioni dell'apprendimento non supervisionato

    Analisi di rete:L'apprendimento non supervisionato viene utilizzato per identificare il plagio e il copyright nell'analisi della rete di documenti dei dati di testo per articoli accademici.Sistemi di raccomandazione:I sistemi di raccomandazione utilizzano ampiamente tecniche di apprendimento non supervisionato per creare applicazioni di raccomandazione per diverse applicazioni web e siti di e-commerce.Rilevamento anomalie:Il rilevamento delle anomalie è un'applicazione popolare di apprendimento non supervisionato, che può identificare punti dati insoliti all'interno del set di dati. Viene utilizzato per scoprire transazioni fraudolente.Scomposizione di un valore singolo:La decomposizione dei valori singolari o SVD viene utilizzata per estrarre particolari informazioni dal database. Ad esempio, estraendo informazioni su ciascun utente che si trova in una determinata posizione.

3. Apprendimento semi-supervisionato

L'apprendimento semi-supervisionato è un tipo di algoritmo di machine learning che si trova tra l'apprendimento automatico supervisionato e quello non supervisionato . Rappresenta la via intermedia tra gli algoritmi di apprendimento supervisionato (con dati di addestramento etichettati) e quelli di apprendimento non supervisionato (senza dati di addestramento etichettati) e utilizza la combinazione di set di dati etichettati e senza etichetta durante il periodo di addestramento.

UN Sebbene l’apprendimento semi-supervisionato sia la via di mezzo tra l’apprendimento supervisionato e quello non supervisionato e operi sui dati costituiti da poche etichette, è costituito principalmente da dati senza etichetta. Poiché le etichette sono costose, ma per scopi aziendali potrebbero avere poche etichette. È completamente diverso dall'apprendimento supervisionato e non supervisionato poiché si basa sulla presenza e sull'assenza di etichette.

Per superare gli inconvenienti degli algoritmi di apprendimento supervisionato e di apprendimento non supervisionato, viene introdotto il concetto di apprendimento semi-supervisionato . Lo scopo principale dell’apprendimento semi-supervisionato è quello di utilizzare in modo efficace tutti i dati disponibili, piuttosto che solo i dati etichettati come nell’apprendimento supervisionato. Inizialmente, dati simili vengono raggruppati insieme a un algoritmo di apprendimento non supervisionato e, inoltre, aiuta a etichettare i dati senza etichetta in dati etichettati. Ciò è dovuto al fatto che i dati etichettati sono un'acquisizione relativamente più costosa rispetto ai dati senza etichetta.

Possiamo immaginare questi algoritmi con un esempio. L'apprendimento supervisionato è quello in cui uno studente è sotto la supervisione di un istruttore a casa e all'università. Inoltre, se lo studente autoanalizza lo stesso concetto senza alcun aiuto da parte dell'istruttore, rientra nell'apprendimento non supervisionato. Nell'apprendimento semi-supervisionato, lo studente deve rivedere se stesso dopo aver analizzato lo stesso concetto sotto la guida di un istruttore al college.

Vantaggi e svantaggi dell'apprendimento semi-supervisionato

Vantaggi:

  • È semplice e facile da capire l'algoritmo.
  • È altamente efficiente.
  • Viene utilizzato per risolvere gli inconvenienti degli algoritmi di apprendimento supervisionato e non supervisionato.

Svantaggi:

  • I risultati delle iterazioni potrebbero non essere stabili.
  • Non possiamo applicare questi algoritmi ai dati a livello di rete.
  • La precisione è bassa.

4. Apprendimento per rinforzo

L'apprendimento per rinforzo funziona su un processo basato sul feedback, in cui un agente AI (un componente software) esplora automaticamente l'ambiente circostante colpendo e seguendo, agendo, imparando dalle esperienze e migliorando le sue prestazioni. L'agente viene ricompensato per ogni buona azione e viene punito per ogni cattiva azione; quindi l'obiettivo dell'agente di apprendimento per rinforzo è massimizzare le ricompense.

Nell’apprendimento per rinforzo, non ci sono dati etichettati come nell’apprendimento supervisionato e gli agenti imparano solo dalle loro esperienze.

Il processo di apprendimento per rinforzo è simile a quello di un essere umano; ad esempio, un bambino impara varie cose attraverso le esperienze della sua vita quotidiana. Un esempio di apprendimento per rinforzo è giocare a un gioco, in cui il gioco è l'ambiente, le mosse di un agente ad ogni passaggio definiscono gli stati e l'obiettivo dell'agente è ottenere un punteggio elevato. L'agente riceve feedback in termini di punizioni e ricompense.

A causa del suo modo di funzionare, l'apprendimento per rinforzo viene utilizzato in diversi campi come Teoria dei giochi, Ricerca Operativa, Teoria dell'informazione, sistemi multi-agente.

Un problema di apprendimento per rinforzo può essere formalizzato utilizzando Processo decisionale di Markov (MDP). In MDP l'agente interagisce costantemente con l'ambiente ed esegue azioni; ad ogni azione l'ambiente risponde e genera un nuovo stato.

Categorie di apprendimento per rinforzo

L’apprendimento per rinforzo è classificato principalmente in due tipi di metodi/algoritmi:

    Apprendimento per rinforzo positivo:L'apprendimento per rinforzo positivo specifica l'aumento della tendenza che il comportamento richiesto si ripeta aggiungendo qualcosa. Migliora la forza del comportamento dell'agente e lo influenza positivamente.Apprendimento per rinforzo negativo:L’apprendimento per rinforzo negativo funziona esattamente in modo opposto al RL positivo. Aumenta la tendenza che il comportamento specifico si ripeta evitando la condizione negativa.

Casi d'uso reali di apprendimento per rinforzo

    Videogiochi:
    Gli algoritmi RL sono molto popolari nelle applicazioni di gioco. Viene utilizzato per ottenere prestazioni sovrumane. Alcuni giochi popolari che utilizzano algoritmi RL sono AlphaGO E AlphaGOZero .Gestione delle risorse:
    Il documento 'Gestione delle risorse con apprendimento per rinforzo profondo' ha mostrato come utilizzare RL nel computer per apprendere e pianificare automaticamente le risorse in attesa di lavori diversi al fine di ridurre al minimo il rallentamento medio del lavoro.Robotica:
    RL è ampiamente utilizzato nelle applicazioni di robotica. I robot vengono utilizzati nell'area industriale e manifatturiera e questi robot sono resi più potenti con l'apprendimento per rinforzo. Esistono diversi settori che hanno la loro visione di costruire robot intelligenti utilizzando l’intelligenza artificiale e la tecnologia di apprendimento automatico.Estrazione di testo
    L'estrazione di testo, una delle grandi applicazioni della PNL, viene ora implementata con l'aiuto del Reinforcement Learning della società Salesforce.

Vantaggi e svantaggi dell'apprendimento per rinforzo

Vantaggi

  • Aiuta a risolvere problemi complessi del mondo reale che sono difficili da risolvere con tecniche generali.
  • Il modello di apprendimento della RL è simile all'apprendimento degli esseri umani; quindi è possibile trovare i risultati più accurati.
  • Aiuta a raggiungere risultati a lungo termine.

Svantaggio

  • Gli algoritmi RL non sono preferiti per problemi semplici.
  • Gli algoritmi RL richiedono enormi quantità di dati e calcoli.
  • Un eccessivo apprendimento per rinforzo può portare a un sovraccarico di stati che può indebolire i risultati.

La maledizione della dimensionalità limita l’apprendimento per rinforzo per i sistemi fisici reali.