Sto cercando di risolvere il seguente problema:
- Un fattorino ha N pacchetti da consegnare, già ordinati.
- Inizia il percorso a
start_time
, lavora fino aend_time
. - Ho dati storici sui suoi programmi di consegna.
- Non ci sono informazioni geografiche tra ogni punto di rilascio.
Come posso prevedere i tempi di consegna per ogni pacchetto?
Ho provato i seguenti approcci, che non sembrano risolverlo in modo appropriato:
- Apprendimento automatico : perfetto per classificare l'input in classi, che non si applica a questo scenario. Ho anche fatto il corso ML Coursera in 2 settimane, solo per vedere se qualche argomento era adatto.
- Filtro di Kalman : o altri algoritmi relativi a DSP si concentrano troppo sulle previsioni in tempo reale, a breve raggio, il che non è il caso. Nessun modo di sfruttare i dati storici.
- Catene di Markov : ottimo per indovinare lo stato attuale, non tanto per un valore futuro.
- Modello matematico : potrei trovare un modello matematico (curve gaussiane?) che denoti il tempo necessario tra la consegna del pacco, a seconda dell'ora del giorno. Sulla base di ciò, prevedere i tempi di consegna.
Su quali argomenti devo concentrarmi?
Alcune note sui dati storici:
- Ho tutto da orari di inizio, orari di fine e tempi di consegna per ogni pacchetto. Ho anche tutti i dati GPS per queste rotte, se questo aiuta.
- I luoghi di consegna devono essere considerati casuali, quindi i tempi di consegna sembrano piuttosto casuali.
- C'è un rallentamento all'ora di pranzo.