Contesto : ho creato un'app che genera intorno a 1000 nomi di dominio in base all'input dell'utente. Devo controllare se sono disponibili o meno confrontando un enorme file di zona con nomi di dominio analizzati che si trova intorno a 2 GB .
Ho un'istanza micro di Amazon e non posso memorizzare il file di testo lì a causa di vincoli di spazio. Mi aspetto circa 100k - 200k e più in query di ricerca al mese.
Approccio ingenuo (Potenzialmente): 1. Archivia il file di testo in dropbox. Quindi recupera il contenuto del file e cerca le stringhe e sputa i nomi di dominio disponibili nell'istanza EC2.
Ho solo bisogno di controllare se i domini esistono o meno. Devo memorizzarlo in un database?
Alcune informazioni: attualmente sono registrati 100 milioni di nomi di punti com in base a Verisign. E i miei nomi di dominio analizzati sono uno su ogni riga. Come:
- APPLE
- STACKOVERFLOW ecc.
Qual è il modo migliore e pratico per affrontare il problema? Idealmente il controllo dovrebbe richiedere solo pochi secondi. Ma sto bene con tutto ciò che funziona a questo punto.