Qual è il collo di bottiglia?
Supponendo che la larghezza di banda sia il tuo problema, ad es. servendo immagini ad alta risoluzione, sarà utile utilizzare una CDN.
Se il tuo sito è computazionalmente costoso, il bilanciamento del carico tra più server suona come la strada da percorrere. Ospitare la tua webapp in un cloud renderà questo ridimensionamento più semplice e potrai sempre ridimensionare o passare a una soluzione conservativa quando puoi stimare con precisione il numero di utenti. Scalare su più server può diventare difficile se gli utenti interagiscono tra loro usando il tuo sito. In tal caso, la comunicazione peer-to-peer tra utenti o una coda di messaggi tra i tuoi server sembra una buona idea.
Potresti voler modificare il tuo stack tecnologico verso prestazioni migliori. Il contenuto statico può essere memorizzato nella cache. Se si sta eseguendo una lingua interpretata sul server, un'implementazione alternativa potrebbe avere un profilo delle prestazioni migliore (possibilmente scambiando tempo di avvio o memoria per un'esecuzione complessiva più veloce). Non ci sono scuse per usare gli script CGI in questo giorno ed età per una moderna webapp.
Non so come si svilupperà il tuo sito. Se stai mirando a un pubblico internazionale, una possibilità sarebbe quella di rilasciare il sito a una certa ora locale per ciascun utente. Una variazione di questo sarebbe di visualizzare il sito come chiuso a una certa percentuale di IP quando il carico è alto. Tuttavia, è preferibile richiedere un indirizzo email per accedere. Se il carico è alto, dì all'utente che riceverà l'e-mail di attivazione tra una decina di minuti (ma poi dargli la priorità). Potresti anche fornire URL con un token di accesso a persone specifiche prima di aprire ufficialmente il sito. Puoi quindi provare a stimare l'interesse del pubblico da varie metriche come la percentuale di persone che hanno usato i loro token, il numero di tweet, ....
Un lancio controllato può essere ottenuto dando a ciascun utente in pre-apertura un numero di ulteriori segnalini, che può dare via. Ciò ti consente di regolare la velocità di espansione, fino a quando non ti apri al pubblico in generale. Fai attenzione a tali tattiche: mentre la scarsità artificiale può aumentare l'interesse, questo rende anche più difficile per il tuo prodotto "diventare virale".
Se ci sono poche fasce fisse per gli utenti disponibili, è possibile visualizzare la loro posizione in una coda di attesa e forse dare un indizio sul tempo di attesa rimanente. Come puoi ridurre il tempo di attesa percepito è una domanda interessante sulla UX.
Alla fine, questa non è solo una domanda tecnica interessante, ma anche una questione di marketing .