Ho uno script che confronta in qualche modo ogni riga da file1
e file2
, e restituisce le righe se c'è una differenza. Voglio renderlo più veloce - adesso è in Python. Potrei usare i thread, ma mi piacerebbe sapere c'è un modo più semplice per migliorarlo?
Poiché ogni test è indipendente, potrebbe essere eseguito in parallelo - Devo solo assicurarmi che ogni riga da file1
venga confrontata con ogni riga da file2
.
EDIT: il collo di bottiglia finora è il processore (processo di confronto); l'utilizzo del disco non è così grande, ma il core con il programma è al 100%. Nota che i file sono "grandi" (ad esempio oltre 20 MB), quindi ho capito che ci vuole del tempo per elaborarli.