L'apprendimento automatico è un sottoinsieme dell'intelligenza artificiale, che consente alla macchina di apprendere automaticamente dai dati, migliorare le prestazioni dalle esperienze passate e fare previsioni . L'apprendimento automatico contiene una serie di algoritmi che funzionano su un'enorme quantità di dati. I dati vengono forniti a questi algoritmi per addestrarli e, sulla base della formazione, costruiscono il modello ed eseguono un compito specifico.
siti web di film simili a 123movies
Questi algoritmi ML aiutano a risolvere diversi problemi aziendali come regressione, classificazione, previsione, clustering e associazioni, ecc.
In base ai metodi e alle modalità di apprendimento, il machine learning si divide principalmente in quattro tipologie, che sono:
- Apprendimento automatico supervisionato
- Apprendimento automatico non supervisionato
- Apprendimento automatico semi-supervisionato
- Insegnamento rafforzativo
In questo argomento forniremo una descrizione dettagliata dei tipi di Machine Learning insieme ai rispettivi algoritmi:
1. Apprendimento automatico supervisionato
Come suggerisce il nome, Apprendimento automatico supervisionato si basa sulla supervisione. Ciò significa che nella tecnica di apprendimento supervisionato addestriamo le macchine utilizzando il set di dati 'etichettato' e, in base all'addestramento, la macchina prevede l'output. Qui, i dati etichettati specificano che alcuni degli input sono già mappati sull'output. Più preziosamente, possiamo dire; per prima cosa addestriamo la macchina con l'input e l'output corrispondente, quindi chiediamo alla macchina di prevedere l'output utilizzando il set di dati di test.
Comprendiamo l'apprendimento supervisionato con un esempio. Supponiamo di avere un set di dati di input di immagini di cani e gatti. Quindi, in primo luogo, forniremo alla macchina la formazione per comprendere le immagini, come ad esempio forma e dimensione della coda di cane e gatto, forma degli occhi, colore, altezza (i cani sono più alti, i gatti sono più piccoli), ecc. Dopo aver completato l'addestramento, inseriamo l'immagine di un gatto e chiediamo alla macchina di identificare l'oggetto e prevedere l'output. Adesso la macchina è ben addestrata, quindi controllerà tutte le caratteristiche dell'oggetto, come altezza, forma, colore, occhi, orecchie, coda, ecc., e scoprirà che è un gatto. Quindi, lo inserirà nella categoria Gatto. Questo è il processo con cui la macchina identifica gli oggetti nell'apprendimento supervisionato.
L'obiettivo principale della tecnica di apprendimento supervisionato è mappare la variabile di input (x) con la variabile di output (y). Alcune applicazioni nel mondo reale dell'apprendimento supervisionato lo sono Valutazione del rischio, rilevamento delle frodi, filtraggio dello spam, eccetera.
Categorie di machine learning supervisionato
L’apprendimento automatico supervisionato può essere classificato in due tipi di problemi, riportati di seguito:
a) Classificazione
Gli algoritmi di classificazione vengono utilizzati per risolvere i problemi di classificazione in cui la variabile di output è categoriale, come ' Sì o No, Maschio o Femmina, Rosso o Blu, ecc . Gli algoritmi di classificazione prevedono le categorie presenti nel dataset. Alcuni esempi reali di algoritmi di classificazione sono Rilevamento spam, filtraggio e-mail, ecc.
Di seguito sono riportati alcuni algoritmi di classificazione popolari:
b) Regressione
Gli algoritmi di regressione vengono utilizzati per risolvere problemi di regressione in cui esiste una relazione lineare tra le variabili di input e di output. Questi vengono utilizzati per prevedere variabili di output continue, come tendenze di mercato, previsioni meteorologiche, ecc.
Di seguito sono riportati alcuni algoritmi di regressione popolari:
Vantaggi e svantaggi dell'apprendimento supervisionato
Vantaggi:
- Poiché l'apprendimento supervisionato funziona con il set di dati etichettato, possiamo avere un'idea esatta delle classi di oggetti.
- Questi algoritmi sono utili per prevedere l'output sulla base dell'esperienza precedente.
Svantaggi:
- Questi algoritmi non sono in grado di risolvere compiti complessi.
- Potrebbe prevedere l'output sbagliato se i dati del test sono diversi dai dati di training.
- Richiede molto tempo di calcolo per addestrare l'algoritmo.
Applicazioni dell'apprendimento supervisionato
Di seguito sono riportate alcune applicazioni comuni dell'apprendimento supervisionato:
Gli algoritmi di apprendimento supervisionato vengono utilizzati nella segmentazione delle immagini. In questo processo, la classificazione delle immagini viene eseguita su diversi dati di immagine con etichette predefinite.
Gli algoritmi supervisionati vengono utilizzati anche in campo medico a fini diagnostici. Viene eseguito utilizzando immagini mediche e dati precedenti etichettati con etichette per condizioni patologiche. Con tale processo, la macchina può identificare una malattia per i nuovi pazienti.
2. Apprendimento automatico non supervisionato
Apprendimento non supervisionato g è diverso dalla tecnica di apprendimento supervisionato; come suggerisce il nome, non è necessaria alcuna supervisione. Ciò significa che, nell'apprendimento automatico non supervisionato, la macchina viene addestrata utilizzando il set di dati senza etichetta e la macchina prevede l'output senza alcuna supervisione.
Nell'apprendimento non supervisionato, i modelli vengono addestrati con dati che non sono né classificati né etichettati e il modello agisce su tali dati senza alcuna supervisione.
Lo scopo principale dell'algoritmo di apprendimento non supervisionato è raggruppare o classificare il set di dati non ordinato in base a somiglianze, modelli e differenze. Alle macchine viene chiesto di trovare i modelli nascosti dal set di dati di input.
Facciamo un esempio per capirlo più preziosamente; supponiamo che ci sia un cesto di immagini di frutta e lo inseriamo nel modello di apprendimento automatico. Le immagini sono totalmente sconosciute al modello e il compito della macchina è trovare i modelli e le categorie degli oggetti.
Quindi, ora la macchina ne scoprirà i modelli e le differenze, come la differenza di colore, la differenza di forma, e prevederà l'output quando verrà testato con il set di dati di test.
Categorie di machine learning non supervisionato
L’apprendimento non supervisionato può essere ulteriormente classificato in due tipologie, riportate di seguito:
1) Raggruppamento
La tecnica del clustering viene utilizzata quando vogliamo trovare i gruppi inerenti dai dati. È un modo per raggruppare gli oggetti in un cluster in modo tale che gli oggetti con il maggior numero di somiglianze rimangano in un gruppo e abbiano meno o nessuna somiglianza con gli oggetti di altri gruppi. Un esempio dell'algoritmo di clustering è raggruppare i clienti in base al loro comportamento di acquisto.
Di seguito sono riportati alcuni degli algoritmi di clustering più diffusi:
2) Associazione
L'apprendimento delle regole di associazione è una tecnica di apprendimento non supervisionato, che trova relazioni interessanti tra le variabili all'interno di un set di dati di grandi dimensioni. Lo scopo principale di questo algoritmo di apprendimento è trovare la dipendenza di un dato da un altro e mappare tali variabili di conseguenza in modo che possa generare il massimo profitto. Questo algoritmo viene applicato principalmente in Analisi del paniere di mercato, mining dell'utilizzo del Web, produzione continua , eccetera.
Alcuni algoritmi popolari di apprendimento delle regole di associazione sono Algoritmo Apriori, Eclat, algoritmo di crescita FP.
Vantaggi e svantaggi dell'algoritmo di apprendimento non supervisionato
Vantaggi:
- Questi algoritmi possono essere utilizzati per compiti complicati rispetto a quelli supervisionati perché funzionano sul set di dati senza etichetta.
- Gli algoritmi non supervisionati sono preferibili per varie attività poiché ottenere il set di dati senza etichetta è più semplice rispetto al set di dati con etichetta.
Svantaggi:
- L'output di un algoritmo non supervisionato può essere meno accurato poiché il set di dati non è etichettato e gli algoritmi non vengono addestrati in precedenza con l'output esatto.
- Lavorare con l'apprendimento non supervisionato è più difficile poiché funziona con il set di dati senza etichetta che non è mappato con l'output.
Applicazioni dell'apprendimento non supervisionato
3. Apprendimento semi-supervisionato
L'apprendimento semi-supervisionato è un tipo di algoritmo di machine learning che si trova tra l'apprendimento automatico supervisionato e quello non supervisionato . Rappresenta la via intermedia tra gli algoritmi di apprendimento supervisionato (con dati di addestramento etichettati) e quelli di apprendimento non supervisionato (senza dati di addestramento etichettati) e utilizza la combinazione di set di dati etichettati e senza etichetta durante il periodo di addestramento.
UN Sebbene l’apprendimento semi-supervisionato sia la via di mezzo tra l’apprendimento supervisionato e quello non supervisionato e operi sui dati costituiti da poche etichette, è costituito principalmente da dati senza etichetta. Poiché le etichette sono costose, ma per scopi aziendali potrebbero avere poche etichette. È completamente diverso dall'apprendimento supervisionato e non supervisionato poiché si basa sulla presenza e sull'assenza di etichette.
Per superare gli inconvenienti degli algoritmi di apprendimento supervisionato e di apprendimento non supervisionato, viene introdotto il concetto di apprendimento semi-supervisionato . Lo scopo principale dell’apprendimento semi-supervisionato è quello di utilizzare in modo efficace tutti i dati disponibili, piuttosto che solo i dati etichettati come nell’apprendimento supervisionato. Inizialmente, dati simili vengono raggruppati insieme a un algoritmo di apprendimento non supervisionato e, inoltre, aiuta a etichettare i dati senza etichetta in dati etichettati. Ciò è dovuto al fatto che i dati etichettati sono un'acquisizione relativamente più costosa rispetto ai dati senza etichetta.
Possiamo immaginare questi algoritmi con un esempio. L'apprendimento supervisionato è quello in cui uno studente è sotto la supervisione di un istruttore a casa e all'università. Inoltre, se lo studente autoanalizza lo stesso concetto senza alcun aiuto da parte dell'istruttore, rientra nell'apprendimento non supervisionato. Nell'apprendimento semi-supervisionato, lo studente deve rivedere se stesso dopo aver analizzato lo stesso concetto sotto la guida di un istruttore al college.
Vantaggi e svantaggi dell'apprendimento semi-supervisionato
Vantaggi:
- È semplice e facile da capire l'algoritmo.
- È altamente efficiente.
- Viene utilizzato per risolvere gli inconvenienti degli algoritmi di apprendimento supervisionato e non supervisionato.
Svantaggi:
- I risultati delle iterazioni potrebbero non essere stabili.
- Non possiamo applicare questi algoritmi ai dati a livello di rete.
- La precisione è bassa.
4. Apprendimento per rinforzo
L'apprendimento per rinforzo funziona su un processo basato sul feedback, in cui un agente AI (un componente software) esplora automaticamente l'ambiente circostante colpendo e seguendo, agendo, imparando dalle esperienze e migliorando le sue prestazioni. L'agente viene ricompensato per ogni buona azione e viene punito per ogni cattiva azione; quindi l'obiettivo dell'agente di apprendimento per rinforzo è massimizzare le ricompense.
Nell’apprendimento per rinforzo, non ci sono dati etichettati come nell’apprendimento supervisionato e gli agenti imparano solo dalle loro esperienze.
Il processo di apprendimento per rinforzo è simile a quello di un essere umano; ad esempio, un bambino impara varie cose attraverso le esperienze della sua vita quotidiana. Un esempio di apprendimento per rinforzo è giocare a un gioco, in cui il gioco è l'ambiente, le mosse di un agente ad ogni passaggio definiscono gli stati e l'obiettivo dell'agente è ottenere un punteggio elevato. L'agente riceve feedback in termini di punizioni e ricompense.
A causa del suo modo di funzionare, l'apprendimento per rinforzo viene utilizzato in diversi campi come Teoria dei giochi, Ricerca Operativa, Teoria dell'informazione, sistemi multi-agente.
Un problema di apprendimento per rinforzo può essere formalizzato utilizzando Processo decisionale di Markov (MDP). In MDP l'agente interagisce costantemente con l'ambiente ed esegue azioni; ad ogni azione l'ambiente risponde e genera un nuovo stato.
Categorie di apprendimento per rinforzo
L’apprendimento per rinforzo è classificato principalmente in due tipi di metodi/algoritmi:
Casi d'uso reali di apprendimento per rinforzo
Gli algoritmi RL sono molto popolari nelle applicazioni di gioco. Viene utilizzato per ottenere prestazioni sovrumane. Alcuni giochi popolari che utilizzano algoritmi RL sono AlphaGO E AlphaGOZero .
Il documento 'Gestione delle risorse con apprendimento per rinforzo profondo' ha mostrato come utilizzare RL nel computer per apprendere e pianificare automaticamente le risorse in attesa di lavori diversi al fine di ridurre al minimo il rallentamento medio del lavoro.
RL è ampiamente utilizzato nelle applicazioni di robotica. I robot vengono utilizzati nell'area industriale e manifatturiera e questi robot sono resi più potenti con l'apprendimento per rinforzo. Esistono diversi settori che hanno la loro visione di costruire robot intelligenti utilizzando l’intelligenza artificiale e la tecnologia di apprendimento automatico.
L'estrazione di testo, una delle grandi applicazioni della PNL, viene ora implementata con l'aiuto del Reinforcement Learning della società Salesforce.
Vantaggi e svantaggi dell'apprendimento per rinforzo
Vantaggi
- Aiuta a risolvere problemi complessi del mondo reale che sono difficili da risolvere con tecniche generali.
- Il modello di apprendimento della RL è simile all'apprendimento degli esseri umani; quindi è possibile trovare i risultati più accurati.
- Aiuta a raggiungere risultati a lungo termine.
Svantaggio
- Gli algoritmi RL non sono preferiti per problemi semplici.
- Gli algoritmi RL richiedono enormi quantità di dati e calcoli.
- Un eccessivo apprendimento per rinforzo può portare a un sovraccarico di stati che può indebolire i risultati.
La maledizione della dimensionalità limita l’apprendimento per rinforzo per i sistemi fisici reali.