Il cloud computing si occupa di problemi ridicolmente paralleli per impostazione predefinita, come la distribuzione di risorse da un URL. Esistono diversi modi per ottenere il parallelismo, indipendentemente dal numero di core che hai. Dovresti costruire la tua applicazione sapendo come intendi approfittarne. Puoi ottenere istanze cloud con più core e molta RAM, ma costano di più.
La maggior parte dei servizi Web viene eseguita all'interno di un server Web incorporato (ad esempio, i servizi Web Spring Boot). Il parallelismo di cui hai bisogno è curato dal server, quindi finché non aggiungi punti di contesa il tuo servizio rimane ridicolmente parallelo e non devi pensare affatto ai thread.
Detto questo, un servizio può gestire solo così tanti clienti contemporaneamente. Ecco perché le soluzioni cloud generalmente portano un'altra istanza online e distribuiscono il traffico tra le istanze del tuo servizio. Molte volte è molto più economico avere un'altra istanza per un breve burst di traffico piuttosto che avere un'istanza con più core.
Quello che non vedi è che il tuo servizio è solitamente ospitato su un server con più core, ma solo sembra simile a uno per te. Quando hai più copie del tuo servizio web in esecuzione, stai utilizzando anche più core.
Il punto è che il parallelismo è lì, hai solo bisogno di sapere come non rovinarlo. Per questo è necessario capire come funziona il parallelismo, ecc.
Hai menzionato la Libreria parallela attività, e questa è una caratteristica chiave dell'approccio di Microsoft per i servizi web, in particolare se abbinato a async
e await
. Capire come funziona aiuterà davvero la tua applicazione a gestire più utenti simultanei. È tempo ben speso.