Algoritmo di clustering che non richiede la definizione del numero di cluster richiesti

3

Ho una serie di query utente da un motore di ricerca che voglio raggruppare. L'unico algoritmo di cluster che ho incontrato finora è il algoritmo di clustering K-means , che richiede la definizione del numero di grappoli in primo piano. Ma in questo caso, non so quanti cluster esistano nei dati. Esiste un algoritmo di clustering che esegue il clustering senza la definizione del numero di cluster?

    
posta Aadith 29.01.2013 - 11:25
fonte

2 risposte

2

DBSCAN?

link

DBSCAN requires two parameters: distance (eps) and the minimum number of points required to form a cluster (minPts).

    
risposta data 29.01.2013 - 13:35
fonte
2

Esistono diverse tecniche che consentono di raggruppare i dati senza supervisione. K-means è probabilmente il più famoso. Ma come hai già visto, la maggior parte degli algoritmi k-means richiede che il numero di cluster sia specificato in anticipo.

Tuttavia, almeno due tipi di algoritmi potrebbero soddisfare le tue esigenze:

  1. Cluster basato sulla connettività (clustering gerarchico) ;
  2. Cluster basato sulla densità (come DBSCAN o OTTICA ).

A proposito, c'è una domanda simile in StackOverflow .

Buon divertimento

    
risposta data 29.01.2013 - 14:15
fonte

Leggi altre domande sui tag