Elaborazione parallela di una struttura su GPU

Question

Elaborazione parallela di una struttura su GPU

#1 da (3 voti)

2

Ho visto alcuni documenti sull'elaborazione parallela / GPU degli alberi, ma dopo averli esaminati brevemente non sono stato in grado di capire cosa hanno fatto. Il più vicino a una spiegazione utile è stato trovato in Parallelizzazione: attraversamento di alberi binari in questo diagramma:

Ma avendo difficoltà a seguire il giornale.

Mi chiedevo se si potesse delineare un algoritmo per l'elaborazione parallela di un albero. In qualche modo posso immaginare che questo sia possibile, e vedere dei documenti su di esso suggerisce che lo è, ma non posso davvero pensare a cosa faresti per realizzarlo.

Se c'è qualche aiuto, in particolare mi chiedo come attraversare un B + tree per trovare le corrispondenze.

Aggiorna

Ecco un altro diagramma (da qui ) che sembra far luce, ma avendo difficoltà a capire .

algorithms parallelism gpu trees

posta Lance Pollard 25.04.2018 - 05:02

fonte

1 risposta

Leggi altre domande sui tag algorithms parallelism gpu trees

Qual è la migliore pratica per l'associazione di oggetti di un vettore ordinato? Calcoli basati su Docker e GPU. Fattibile? [chiuso]

score 3 · Answer 1

È molto semplice.

Quando si reciterebbe verso il basso il figlio sinistro quindi il bambino giusto, si avvierà invece un'attività che si ripete verso il basso a sinistra e proseguirà verso il basso a destra. Quando hai finito con la destra, potresti dover aspettare a sinistra, ma in un albero bilanciato che non sarà lungo

Quando sei al livello di profondità N nella struttura, hai il potenziale per 2^N di core funzionanti

Quel diagramma specifico è solo la generazione di attività a profondità specifiche, probabilmente perché non sono attività di accodamento. Ciò sta utilizzando la conoscenza della struttura dell'albero per non sovraccaricare lo schedulatore

Se hai una coda di attività e un pool di thread, l'implementazione può sfruttare quelli per non doversi preoccupare della quantità di attività generate.

Di 'che hai

class Node 
{
    int data; // or w/e

    Node * left;
    Node * right;

    template <typname Action>
    void SerialTraverse(Action action)
    {
        action(data); // Pre-order traversal

        if (left) left->SerialTraverse(action);
          // Traverse the left
        if (right) right->SerialTraverse(action);
          // Traverse the right
    }
}

namespace library 
{
    template<typename Task, typename Class, typename Arg>
    std::future<void> enqueue_task(Task task, Class * obj, Arg arg);
    // on some other thread, call "obj->task(arg);"
    // returns a handle upon which we can wait
}

Quindi puoi cambiare SerialTraverse in

    template <typname Action>
    void ParallelTraverse(Action action)
    {
        action(data);
        std::future<void> fut;
        if (left) fut = library::enqueue_task(ParallelTraverse, left, action);
          // start traversing left on another thread

        if (right) right->ParallelTraverse(action);
          // traverse right on this thread, in parallel to traversing left

        if (fut.valid()) fut.wait();
          // wait for the left traversal to end
    }