Algoritmo che determina gli attributi rilevanti nella lista ordinata

3

Supponiamo di avere una lista di oggetti ordinati da una persona in base al gusto soggettivo di quella persona. Supponiamo che questa persona sia un po 'coerente nel loro ordinamento e che ci siano attributi quantificabili di questi oggetti che posso identificare. Ad esempio, una persona potrebbe ordinare il formaggio basandosi su quanto gli piace il gusto, e le persone a cui non piaceva il sale avrebbero classificato il formaggio salato più in basso rispetto ai formaggi a basso contenuto di sale. Ad una persona potrebbe non interessare quale fosse il colore del formaggio o se provenisse da mucche, capre o pecore, mentre un altro potrebbe classificare formaggi di latte di pecora più alti dei formaggi di capra.

Presumo che esista una procedura per identificare quali attributi degli elementi di dati in un elenco sono e non sono rilevanti per determinare l'ordine. Qual è il nome di questo problema e quali algoritmi esistono per risolverlo? (idealmente in Python)

    
posta Jordan Reiter 24.12.2013 - 22:34
fonte

1 risposta

4

Poiché l'ordinamento non è necessariamente perfetto, la prima cosa che viene in mente è analisi di regressione .

Per ogni proprietà, si desidera determinare la forza di una correlazione tra gli indici degli elementi (la variabile di risposta) e i valori di tale proprietà. Penso che tu possa quindi supporre che - o chiedere all'utente se - la proprietà ordinata è quella che hai trovato per avere la correlazione più strong.

Se si possono prendere in considerazione più proprietà nell'ordinamento, come potrebbero benissimo essere, è necessario utilizzare la regressione multivariata. Immagino che considereresti i 2 n possibili sottoinsiemi di tutte le proprietà, se n è piccolo, oppure solo la dimensione- k sottoinsiemi.

    
risposta data 25.12.2013 - 03:42
fonte

Leggi altre domande sui tag