Per diminuire il numero di falsi positivi, ho trovato un paio di soluzioni possibili.
-
Crea due diversi tipi di filtri Bloom; per esempio. filter1 utilizzando 3 diversi algoritmi hash, filter2 utilizzando altri 3 algoritmi hash.
-
Crea due diverse lunghezze di un filtro Bloom di tipo; per esempio. il numero di bit sarebbe diverso, quindi la modulazione hash sarebbe diversa.
-
Crea due diversi tipi di filtri Bloom con due diverse lunghezze. Credo che il numero 2 sarebbe il più veloce, ma in teoria sarebbe meglio usare # 1 (o # 3), al fine di (facilmente / rapidamente) ridurre il numero di falsi positivi il più possibile?
La maggior parte delle volte, lo userei per brevi stringhe di testo (fino a circa 20 caratteri) e URL.