Nell'argomento precedente abbiamo appreso l'apprendimento automatico supervisionato in cui i modelli vengono addestrati utilizzando dati etichettati sotto la supervisione dei dati di addestramento. Ma potrebbero esserci molti casi in cui non disponiamo di dati etichettati e dobbiamo trovare i modelli nascosti dal set di dati fornito. Quindi, per risolvere questo tipo di casi nell’apprendimento automatico, abbiamo bisogno di tecniche di apprendimento non supervisionato.
Cos'è l'apprendimento non supervisionato?
Come suggerisce il nome, l'apprendimento non supervisionato è una tecnica di apprendimento automatico in cui i modelli non vengono supervisionati utilizzando set di dati di addestramento. Invece, i modelli stessi trovano i modelli e le intuizioni nascoste dai dati forniti. Può essere paragonato all'apprendimento che avviene nel cervello umano mentre si imparano cose nuove. Può essere definito come:
test di regressione nei test del software
L'apprendimento non supervisionato è un tipo di apprendimento automatico in cui i modelli vengono addestrati utilizzando set di dati senza etichetta e possono agire su tali dati senza alcuna supervisione.
L’apprendimento non supervisionato non può essere applicato direttamente a un problema di regressione o classificazione perché, a differenza dell’apprendimento supervisionato, abbiamo i dati di input ma non i dati di output corrispondenti. L’obiettivo dell’apprendimento non supervisionato è quello di trovare la struttura sottostante del set di dati, raggruppare i dati in base alle somiglianze e rappresentare il set di dati in un formato compresso .
Esempio: Supponiamo che all'algoritmo di apprendimento non supervisionato venga fornito un set di dati di input contenente immagini di diversi tipi di cani e gatti. L'algoritmo non viene mai addestrato sul set di dati specificato, il che significa che non ha alcuna idea delle caratteristiche del set di dati. Il compito dell'algoritmo di apprendimento non supervisionato è identificare autonomamente le caratteristiche dell'immagine. L'algoritmo di apprendimento non supervisionato eseguirà questo compito raggruppando il set di dati di immagini in gruppi in base alle somiglianze tra le immagini.
Perché utilizzare l'apprendimento non supervisionato?
Di seguito sono riportati alcuni motivi principali che descrivono l’importanza dell’apprendimento non supervisionato:
- L'apprendimento non supervisionato è utile per trovare informazioni utili dai dati.
- L’apprendimento non supervisionato è molto simile in quanto un essere umano impara a pensare in base alle proprie esperienze, il che lo rende più vicino alla vera intelligenza artificiale.
- L'apprendimento non supervisionato funziona su dati senza etichetta e senza categoria, il che rende l'apprendimento non supervisionato più importante.
- Nel mondo reale, non sempre disponiamo di dati di input con l'output corrispondente, quindi per risolvere questi casi abbiamo bisogno di un apprendimento non supervisionato.
Funzionamento dell'apprendimento non supervisionato
Il funzionamento dell'apprendimento non supervisionato può essere compreso dal diagramma seguente:
l'eccezione lancia Java
Qui abbiamo preso dati di input senza etichetta, il che significa che non sono categorizzati e non vengono forniti nemmeno gli output corrispondenti. Ora, questi dati di input senza etichetta vengono inviati al modello di machine learning per addestrarlo. In primo luogo, interpreterà i dati grezzi per trovare i modelli nascosti dai dati e quindi applicherà algoritmi adeguati come il clustering k-means, l'albero decisionale, ecc.
Una volta applicato l'algoritmo adatto, l'algoritmo divide gli oggetti dati in gruppi in base alle somiglianze e alle differenze tra gli oggetti.
Tipi di algoritmi di apprendimento non supervisionato:
L’algoritmo di apprendimento non supervisionato può essere ulteriormente classificato in due tipi di problemi:
Nota: impareremo questi algoritmi nei capitoli successivi.
Algoritmi di apprendimento non supervisionato:
Di seguito è riportato l'elenco di alcuni popolari algoritmi di apprendimento non supervisionato:
Vantaggi dell'apprendimento non supervisionato
- L'apprendimento non supervisionato viene utilizzato per compiti più complessi rispetto all'apprendimento supervisionato perché, nell'apprendimento non supervisionato, non abbiamo dati di input etichettati.
- L'apprendimento non supervisionato è preferibile poiché è facile ottenere dati senza etichetta rispetto a dati etichettati.
Svantaggi dell'apprendimento non supervisionato
- L’apprendimento non supervisionato è intrinsecamente più difficile dell’apprendimento supervisionato poiché non ha risultati corrispondenti.
- Il risultato dell'algoritmo di apprendimento non supervisionato potrebbe essere meno accurato poiché i dati di input non sono etichettati e gli algoritmi non conoscono in anticipo l'output esatto.