Ha più filtri Bloom ha senso?

0

Per diminuire il numero di falsi positivi, ho trovato un paio di soluzioni possibili.

  1. Crea due diversi tipi di filtri Bloom; per esempio. filter1 utilizzando 3 diversi algoritmi hash, filter2 utilizzando altri 3 algoritmi hash.

  2. Crea due diverse lunghezze di un filtro Bloom di tipo; per esempio. il numero di bit sarebbe diverso, quindi la modulazione hash sarebbe diversa.

  3. Crea due diversi tipi di filtri Bloom con due diverse lunghezze. Credo che il numero 2 sarebbe il più veloce, ma in teoria sarebbe meglio usare # 1 (o # 3), al fine di (facilmente / rapidamente) ridurre il numero di falsi positivi il più possibile?

La maggior parte delle volte, lo userei per brevi stringhe di testo (fino a circa 20 caratteri) e URL.

    
posta Arseni Mourzenko 09.11.2014 - 19:29
fonte

0 risposte

Leggi altre domande sui tag