Vorrei raggruppare una popolazione in base a due criteri. Userò un'analogia per semplificare la mia domanda.
Diciamo che voglio n numero di gruppi. Voglio popolare questi gruppi in base all'età e al peso della persona, in modo che tutti i gruppi contengano all'incirca la stessa età e siano distribuiti uniformemente in base al peso (in modo che ci siano circa lo stesso numero di persone pesanti e leggere in ciascun gruppo).
Che tipo di algoritmo posso utilizzare per automatizzare questo processo? C'è una semplice formula di Excel o qualche altro metodo?
Aggiorna
Ecco la motivazione per questa analisi statistica. Vorrei impostare il partizionamento in un database che avrà le migliori prestazioni. Ho bisogno di memorizzare molti dati raggruppati per contea. Non so in anticipo, quale sarebbe il miglior numero di partizioni. Le partizioni dovrebbero essere uniformi, in modo che contengano lo stesso numero di righe. Una partizione dovrebbe contenere righe di dati per una o più contee. Ogni contea sarà classificata in base alla frequenza e alla possibile quantità di aggiornamenti. Le partizioni dovrebbero essere costruite in modo tale che i dati di contea aggiornati di frequente siano distribuiti uniformemente.
Non sembra che ci sia un modo semplice per farlo. Quindi che tipo di algoritmo avrebbe funzionato per questo? Probabilmente non userei VBA per la codifica, invece molto probabilmente userei Perl per scrivere il programma per fare l'analisi. Esistono strumenti statistici pronti per questo tipo di analisi?
Permettimi di chiarire cosa intendo quando dico n numero di gruppi. Prenderò fondamentalmente un numero di gruppi (partizioni), collegandolo alla formula o allo strumento di analisi o al programma personalizzato. Quindi ripeterò il processo per un diverso numero di gruppi (partizioni) finché non troverò per tentativi ed errori il numero di partizioni che offre le migliori prestazioni.
Forse c'è un nome per questo tipo di analisi? Qualcosa che potrei provare a cercare tramite un motore di ricerca?