Vai al contenuto
Menu principale
Menu principale
sposta nella barra laterale
nascondi
Navigazione
Pagina principale
Ultime modifiche
Una pagina a caso
Aiuto su MediaWiki
Unipedia
Ricerca
Ricerca
entra
Strumenti personali
entra
Pagine per utenti anonimi
ulteriori informazioni
contributi
discussioni
Modifica di
Apprendimento non supervisionato
(sezione)
Pagina
Discussione
italiano
Leggi
Modifica
Cronologia
Strumenti
Strumenti
sposta nella barra laterale
nascondi
Azioni
Leggi
Modifica
Cronologia
Generale
Puntano qui
Modifiche correlate
Pagine speciali
Informazioni pagina
Attenzione:
non hai effettuato l'accesso. Se effettuerai delle modifiche il tuo indirizzo IP sarà visibile pubblicamente. Se
accedi
o
crei un'utenza
, le tue modifiche saranno attribuite al tuo nome utente, insieme ad altri benefici.
Controllo anti-spam.
NON
riempirlo!
== Clustering == Il clustering è uno degli approcci centrali nell'apprendimento non supervisionato. È una tecnica che mira a raggruppare "oggetti" simili all’interno di un unico gruppo, detto cluster. Ogni cluster è caratterizzato da una massima somiglianza interna e da una minima somiglianza rispetto agli altri cluster, secondo un determinato indice di similarità.<ref>Aggarwal e Reddy, ''Data Clustering'', p. 31.</ref> Per esempio, si consideri il caso in cui vengano registrati gli spettri di centomila stelle. È possibile identificare, a partire da questi dati, diversi tipi di stelle? E quanti sarebbero, con quali caratteristiche distintive? Termini come “gigante rossa” o “nana bianca” non corrispondono a etichette esplicite presenti in natura: si tratta di categorie costruite a posteriori attraverso un'attività umana di analisi e classificazione. Gli astronomi, infatti, hanno dovuto applicare tecniche di clustering non supervisionato, analizzando le somiglianze negli spettri per raggruppare le stelle in classi omogenee sulla base delle loro proprietà fisiche.<ref>Russell e Norvig, ''Artificial Intelligence. A Modern Approach'', p. 789.</ref> Tuttavia, quando i dati sono rappresentati in spazi ad alta dimensione, cioè con un numero elevato di caratteristiche (o feature) per ciascun oggetto, l’individuazione di tali gruppi diventa computazionalmente onerosa e può compromettere la qualità dell’apprendimento. Inoltre, differenti sottoinsiemi di caratteristiche possono produrre cluster tra loro differenti ma ugualmente coerenti, rendendo ambigua l’interpretazione dei risultati. Per questi motivi, ovvero l’elevato costo computazionale e la variabilità dei risultati dovuta all’alta dimensionalità, si rende necessario l’impiego di tecniche di selezione delle caratteristiche (feature selection) nell’ambito del clustering, al fine di ridurre l’impatto negativo della dimensionalità elevata e migliorare la qualità dei gruppi individuati.<ref>Aggarwal e Reddy, ''Data Clustering'', p. 31.</ref>
Oggetto:
Per favore tieni presente che tutti i contributi a Unipedia possono essere modificati, stravolti o cancellati da altri contributori. Se non vuoi che i tuoi testi possano essere alterati, allora non inserirli.
Inviando il testo dichiari inoltre, sotto tua responsabilità, che è stato scritto da te personalmente oppure è stato copiato da una fonte di pubblico dominio o similarmente libera (vedi
Unipedia:Copyright
per maggiori dettagli).
Non inviare materiale protetto da copyright senza autorizzazione!
Annulla
Guida
(si apre in una nuova finestra)
Toggle limited content width