Vai al contenuto
Menu principale
Menu principale
sposta nella barra laterale
nascondi
Navigazione
Pagina principale
Ultime modifiche
Una pagina a caso
Aiuto su MediaWiki
Unipedia
Ricerca
Ricerca
entra
Strumenti personali
entra
Pagine per utenti anonimi
ulteriori informazioni
contributi
discussioni
Modifica di
Apprendimento non supervisionato
(sezione)
Pagina
Discussione
italiano
Leggi
Modifica
Cronologia
Strumenti
Strumenti
sposta nella barra laterale
nascondi
Azioni
Leggi
Modifica
Cronologia
Generale
Puntano qui
Modifiche correlate
Pagine speciali
Informazioni pagina
Attenzione:
non hai effettuato l'accesso. Se effettuerai delle modifiche il tuo indirizzo IP sarà visibile pubblicamente. Se
accedi
o
crei un'utenza
, le tue modifiche saranno attribuite al tuo nome utente, insieme ad altri benefici.
Controllo anti-spam.
NON
riempirlo!
== Validazione del clustering == Poiché il clustering è un compito non supervisionato, risulta fondamentale disporre di misure di validazione per valutare la qualità delle partizioni ottenute. Senza tali strumenti, sarebbe difficile stabilire se i gruppi trovati riflettano realmente una struttura coerente nei dati.<ref>Aggarwal e Reddy, ''Data Clustering'', p. 572.</ref> Le misure di validazione si suddividono in due categorie principali: *Le misure di validazione esterna si basano su informazioni esterne al dataset (come etichette di classe note) per confrontare la struttura del clustering con una classificazione di riferimento. Esempi comuni sono l’entropia, l’indice Rand e la F-measure. *Le misure di validazione interna valutano invece la bontà del clustering esclusivamente sulla base della distribuzione interna dei dati, senza bisogno di etichette. Un esempio ampiamente utilizzato è l’indice di Silhouette, che misura la compattezza dei cluster e la separazione tra essi. Le misure interne sono particolarmente utili quando non sono disponibili dati etichettati, come accade spesso nei casi reali. Tuttavia, entrambe le famiglie di misure presentano limiti: per esempio, le etichette possono non riflettere fedelmente la struttura dei dati, o le metriche interne possono risultare sensibili al rumore o alla presenza di sottocluster.<ref>Aggarwal e Reddy, ''Data Clustering'', p. 573.</ref>
Oggetto:
Per favore tieni presente che tutti i contributi a Unipedia possono essere modificati, stravolti o cancellati da altri contributori. Se non vuoi che i tuoi testi possano essere alterati, allora non inserirli.
Inviando il testo dichiari inoltre, sotto tua responsabilità, che è stato scritto da te personalmente oppure è stato copiato da una fonte di pubblico dominio o similarmente libera (vedi
Unipedia:Copyright
per maggiori dettagli).
Non inviare materiale protetto da copyright senza autorizzazione!
Annulla
Guida
(si apre in una nuova finestra)
Toggle limited content width