Determina l'etichetta cluster in K-means

-1

Ho un set di dati che contiene 150 dati che sono effettivamente divisi in 3 gruppi. Ogni gruppo ha la propria etichetta.

Faccio processo di clustering con algoritmo K-means per raggruppare i dati.

Ho bisogno di assegnare l'etichetta di ogni gruppo che viene creato dal processo K-means. Così ho potuto confrontare il risultato di K-means con il training dei dati.

Qualcuno potrebbe aiutare a spiegare come determinare l'etichetta di ciascun gruppo?

    
posta dipa 23.05.2014 - 12:43
fonte

2 risposte

0

scegli arbitrariamente l'etichetta per ciascun gruppo e verifica il risultato con ciascuno dei 3! permutazioni

o se l'etichetta si riferisce alla posizione relativa che puoi usare, N è assegnata al gruppo con la coordinata y più alta e così via

    
risposta data 23.05.2014 - 12:53
fonte
0

Leggi su valutazione del cluster in Wikipedia.

Nessun algoritmo di cluster assegnerà un'etichetta come iris_setosa al cluster, a meno che tu non fornisca le etichette all'algoritmo di clustering in qualche modo (ma in questo caso non è più il clustering, in realtà, ma la classificazione).

Quindi avrai solo first_cluster , second_cluster , third_cluster tipo di etichette.

Ci sono varie misure proposte per confrontare la struttura dei cluster rispetto al set di dati originale. Ma di solito non ci sarà una corrispondenza 1: 1 alle etichette originali.

    
risposta data 23.05.2014 - 13:49
fonte

Leggi altre domande sui tag