Qualcuno può spiegare cosa significa il fattore di sconto nel Algoritmo di Iterazione del Valore per la risoluzione di Processi decisionali di Markov ?
Comprendo l'equazione, ma non capisco perché richieda il fattore di sconto (gamma).
Qualcuno può spiegare cosa significa il fattore di sconto nel Algoritmo di Iterazione del Valore per la risoluzione di Processi decisionali di Markov ?
Comprendo l'equazione, ma non capisco perché richieda il fattore di sconto (gamma).
Ecco cosa ho capito: il fattore di sconto rappresenta la preferenza delle soluzioni a breve termine rispetto alle soluzioni a lungo termine.
Ad esempio, se potessi guadagnare $ 1 oggi, lo valuterei più di $ 1 che potrei guadagnare domani, e molto più di $ 1 che potrei guadagnare il 1 ° gennaio 2050, perché la situazione di cambiamento fattoriale casuale sempre di più come il tempo passa. Il fattore di sconto indica quanto costa oggi $ 1 in più rispetto a $ 1 di domani.
Poiché l'intero algoritmo consiste nel prendere decisioni in cui il risultato dipende in parte da input casuali che possono allontanarsi nel tempo, invalidando la decisione iniziale, ha senso preferire le decisioni che sono migliori come soluzioni a breve termine.
Leggi altre domande sui tag artificial-intelligence