Come misurare il grado di ordine in una lista?

6

Le seguenti domande mi hanno fatto riflettere:

Quando si ordina una lista, si ha sempre una linea di base (numeri, alfabeto, ...) che ti dice come ordinare l'elenco.

Domanda : quando mischia un set, come misuri il "grado di ordine"?

Ad esempio: 9 8 7 6 5 4 3 2 1 è ordinato, anche se completamente diverso da 1 2 3 4 5 6 7 8 9. E anche 9 8 7 6 1 2 3 4 5 ha qualche ordine (se guardalo a pezzi: 9 8 7 6 e 1 2 3 4 5). Un altro esempio potrebbe essere 9 2 3 4 5 6 7 8 1. Come puoi determinare se un annuncio è meno o più ordinato di un altro.

Nota : poiché c'è stata una certa confusione circa l'obiettivo di questa domanda - vorrei specificare che io sono non in cerca di un metodo per misurare la casualità . 1234 è solo un insieme casuale di 4 cifre come 4213, ma mi sembra che 1234 sia più ordinato di 4213. Il commento sulla "complessità di Kolmogorov" di user61852, o la risposta di Mathew Foscarini che menziona misurando la deviazione tra numeri vicini in una sequenza, sono i tipi di risposte che sto cercando. Non sono sicuro che l'approccio di entropia della misura nel commento di MichaelT aiuti a identificare l'ordine in una lista, se i commenti potrebbero essere elaborati in risposte che sarebbero grandiose.

    
posta Rafael Emshoff 28.05.2013 - 18:11
fonte

3 risposte

4

La struttura di un gruppo di numeri di ordini è misurata dalla deviazione tra i numeri.

Data una sequenza di 1 2 3 4 5 6 7 8 ogni numero devia di 1 dal suo vicino. Una deviazione coerente applica la sequenza ha struttura.

Se due sequenze condividono le stesse deviazioni tra i numeri, allora hanno lo stesso livello di complessità o mancanza di complessità. 1 2 3 4 5 e 8 9 10 11 12 entrambi deviano per 1 e non condividono numeri.

La deviazione non si applica a quale tipo di struttura. Definisce semplicemente un valore per la struttura. Esempio; 1 2 1 2 1 2 e 1 2 3 4 5 6 hanno entrambi una deviazione di 1 .

Una deviazione non sequenziale e non ripetitiva non implica una sequenza casuale. Implica semplicemente una variazione costante nella struttura della sequenza.

Ricorda che casualità e non ripetizione sono differenti. I numeri casuali si ripetono e vengono eseguiti in sequenza. La casualità di una sequenza può essere calcolata campionando altre sequenze dalla stessa popolazione di dati. Se hai solo una sequenza, non è possibile dire se l'intera sequenza è casuale.

Se abbiamo una sequenza di numeri di 3 cifre, è possibile che ogni numero a 3 cifre sia casuale. Tira un set di 3 dadi abbastanza volte e il numero 666 salirà tante volte quante 123 .

Se hai una sequenza di numeri. Puoi dividere quella sequenza in parti più piccole e poi calcolare le quote di quella piccola sequenza che appare. Se trovi che una sequenza si ripete più spesso allora dovrebbe, allora quei pezzi non appariranno casualmente.

Ad esempio;

227322282364622617 spezzato in numeri a 2 cifre sarebbe

22 73 22 28 23 64 62 26 17

Le probabilità di un numero a 2 cifre appaiono o 1 su 100, ma il numero 22 appare due volte. Se la nostra sequenza fosse abbastanza lunga. Potremmo sapere se 22 appare più spesso di una volta ogni 100 coppie.

    
risposta data 28.05.2013 - 20:20
fonte
3

Quando si valuta un algoritmo shuffling per determinare se genera veramente una sequenza "casuale" non si può semplicemente guardare una sequenza. 1 2 3 4 5 è un risultato perfettamente valido di mischiare 5 numeri. Ciò che è importante quando si valuta un algoritmo di shuffling è che ogni singolo ordine possibile è altrettanto probabile. In quanto tale, ogni singolo ordine possibile è un risultato "valido" di mischiare la lista.

Quindi, come stabilisci se il tuo algoritmo di shuffling è "equo" o se è "di parte"?

Per prima cosa dovrai generare un sacco di sequenze casuali. Dovrebbe essere almeno di un ordine di grandezza, se non di più, più grande della dimensione della lista.

Successivamente, determina la percentuale di tempo in cui ciascuna voce appare in ciascuna posizione della lista. Dovresti trovare che ogni elemento appare in ciascuna posizione circa 1 / n% delle volte (dove n è la dimensione della lista). Se alcuni oggetti hanno più probabilità di apparire in determinate posizioni, allora il tuo algoritmo di mischia non è "equo".

    
risposta data 28.05.2013 - 20:31
fonte
1

Ordinato significa mancanza di devianza nella progressione, ripetendo o incrementi di devianza. Come contare da uno, contare per due, ecc. Tuttavia, organizzare numeri casuali dal più piccolo al più grande è sicuramente ordinarli, a meno che non sia nascosto in un gruppo più grande di numeri.

Viene anche ordinata una devianza incrementale, ma non tanto, come 1, (+ 1) 2, (+2) 5.

2 4 6 8 è più ordinato di 1 2 5 8 Anche se la devianza media è minore nel secondo numero.

La chiave è la deviazione delle deviazioni (delle deviazioni). Quindi, se puoi misurare quello, determinare se c'è una progressione, o un modello che si ripete (o progredisce), dovresti essere in grado di confrontare un insieme di numeri con altri per determinare se uno è più ordinato dell'altro come test factorable .

    
risposta data 06.07.2013 - 06:29
fonte

Leggi altre domande sui tag