Fondamentalmente, mi chiedo quale velocità otterrò parallelizzando un algoritmo per lavorare con le GPU. Mi chiedo se qualcuno ha implementato la teoria delle code / la legge di Amdahl con un'interfaccia utente o se ognuno implementa la propria soluzione?
PS: Sì, sono consapevole che tutto dipende dalla natura dell'algoritmo (perché pensi che mi riferisca alla legge di Amdahl). Sono anche consapevole del fatto che molti produttori presentano cose in termini di FLOP e che questa non è necessariamente la migliore metrica da usare.
Inoltre, tende ad essere una sola pipa che entra ed esce, quindi c'è probabilmente una buona quantità di dati da trasferire sulla carta e fuori dalla carta.
Dal momento che nessuno ha commentato uno strumento generale che potrebbe aiutare qualcuno a sviluppare algoritmi / codice per GPU, ci sono delle regole pratiche per aiutarli a personalizzare il loro codice per l'esecuzione su una GPU specifica?