Sto usando curl_multi_exec per elaborare più di 100.000 richieste. Faccio 100 richieste alla volta perché curl_multi_exec può gestire solo 100 richieste alla volta per ottenere infine richieste di 100K. Abbiamo aggiunto più server a questo sistema per distribuire il carico [stiamo utilizzando il bilanciamento del carico]. Qual è il modo migliore per gestire le richieste 100K di curl e utilizzare questi server aggiuntivi? Qual è il lato negativo (diverso dal tempo) della gestione di molte richieste su un server? Come posso utilizzare i server aggiuntivi per gestire queste richieste?
Stavo pensando di far gestire a ciascun server un batch di richieste (come un server gestisce 500 richieste, un altro 500, un altro 500, ecc.
Per elaborare - in sostanza, stiamo usando arricciatura per inviare oltre 100.000 richieste a server di terze parti. Il problema con l'utilizzo di un solo server è che esiste un limite di memoria nel numero di richieste che un server può gestire. Quindi abbiamo deciso di aggiungere altri server, ma non siamo sicuri di come progettare questo sistema per utilizzare curl per gestire le numerose richieste ..
Il server di terze parti è un'API come Facebook; sono consapevoli che faremo molte richieste ai loro server.
Per il bilanciamento del carico, utilizziamo il cloud server di Rackspace, in pratica il bilanciamento del carico indirizza le richieste in entrata a server separati.