Sono molto confuso nell'implementazione di MCTS per un gioco di connessione 5. Secondo Wikipedia :
Selezione: inizia dalla radice R e seleziona i nodi figli successivi fino a un nodo foglia L.
Diciamo che è il turno dell'AI. Lo stato attuale della scheda è R . Non dovrebbero esserci nodi figli di R , giusto? Quindi, come è possibile "selezionare i nodi secondari successivi su un nodo foglia L "? Perché non hai nodi figli di R. Il nodo figlio L significa ogni singola mossa che l'IA può fare da R ?
Se quel nodo figlio L , che è uno stato di gioco, non è una vittoria né per l'IA né per il giocatore, giocate casualmente delle mosse fino ad alcune vittorie, e retrocopate fino a R . Cosa fai dopo il backpropagating?
Non capisco come si seleziona il nodo figlio L . Ancor prima, non sono sicuro di come viene creato L . Sembra molto strano perché sembra che tu stia "selezionando" un nodo figlio sul primissimo passaggio.
Sarebbe bello se qualcuno potesse semplificarlo. Grazie.