Ho elenchi di dati che sto cercando di organizzare dove la lista con la minima variazione / maggior precisione / più vicina alla media e la maggior parte dei dati è la più votata. Alcuni degli elenchi sono come 2000 numeri lunghi e altri hanno solo 1 numero. Ovviamente la media aritmetica di una lista con un numero sarà esattamente il valore del numero uno. Qualsiasi valore individuale da un elenco di 2000 numeri potrebbe non essere il più vicino alla media aritmetica. Quando si ordinano questi, tutti gli elenchi più piccoli avranno un punteggio più alto.
Sembra davvero facile, ma non riesco a trovare un modo per ordinare la lista in modo più proporzionato.
Esempi di elenchi:
Elenco 1
12, 20, 15, 17, 9, 19
Average of list:
12+20+15+17+9+19/6=15
Score: (15-12) + (20-15) + (15-15) + (17-15) + (15-9) + (19-15)= 20
Elenco 2
30
Average of list: 30/1=30
Score: (30-30) = 0
Elenco 3
10, 10, 10, 10, 10, 10, 10, 10, 10, 9
Score: (10-10)...etc = 1
Classifica
-
Elenco 2: Punteggio = 0
-
Elenco 3: Punteggio = 1
-
Elenco 1: Punteggio = 20
Questo è quello che ho adesso. Il problema con questo è che la lista 2 sarà in cima perché è piccola. Mi piacerebbe che la lista 3 fosse al top perché il punteggio è piccolo e ha molti membri. Non sono sicuro di come aggiungere peso alla dimensione però. L'elenco 1 è un esempio di un elenco con molti membri, nessuno dei quali è veramente vicino alla media. Ecco due cose brutte quindi dovrebbe essere in fondo.
Per quanto riguarda i valori anomali, non vengono trattati in modo diverso. Se un numero altissimo dà una lista un punteggio veramente brutto va bene.