Elenco di caratteri visivamente simili, per rilevare attacchi di spoofing e social engineering

17

Sto provando a rilevare attacchi omografati e altri attacchi in cui un utente malintenzionato utilizza un nome di dominio di contraffazione che sembra visivamente simile a un nome di dominio fidato (ad esempio, bankofthevvest.com invece di bankofthewest.com).

Esiste un dizionario o un database di caratteri visivamente simili che è adatto per l'uso programmatico?

Ad esempio, se cerco "l", vorrei tornare a un elenco che indica che "l" è visivamente simile a "1" e "i" (almeno in alcuni tipi di carattere). Se guardo su "w", potrebbe dirmi che è visivamente simile a "vv" (in alcuni tipi di carattere). Se guardo "d", potrebbe dirmi che è visivamente simile a "cl" (in alcuni tipi di carattere). Almeno per ora, il mio obiettivo è la somiglianza visiva tra i caratteri ASCII. Va bene ignorare Unicode. (Tuttavia, è un bonus extra se c'è una lista che sa anche quali caratteri Unicode sono visivamente simili a ogni carattere ASCII.)

Se esiste già una cosa del genere, vorrei evitare di reinventare la ruota. Esiste già un elenco di questo tipo?

Ecco cosa ho trovato finora:

posta D.W. 25.06.2016 - 21:51
fonte

2 risposte

8

Prova a cercare con il termine "Homoglyph" invece di "homograph".

Ad esempio, questo potrebbe essere quello che volevi:

link

Contiene codice e dizionari.

    
risposta data 27.06.2016 - 16:08
fonte
8

Esistono diversi approcci per gli attacchi di omografi. Il successo dipende dal tipo di carattere utilizzato. Ad esempio, in alcuni caratteri la lettera minuscola assomiglia molto alla lettera maiuscola I. E in altri no.

Analogie

Usa caratteri simili. Sostituiscono il vero personaggio.

  • b ⇔ 6
  • c ⇔ (
  • g ⇔ q, 9
  • C ⇔ (
  • G ⇔ 6
  • L ⇔ l, I, 1, |
  • O ⇔ 0
  • S ⇔ 5
  • V ⇔ U
  • Z ⇔ 2

Caratteri di modifica del suono

Alcune lingue, come il tedesco, hanno caratteri speciali (ad es. umlaut). In alcune circostanze possono sembrare un personaggio senza di loro:

  • a ⇔ ä, à, á
  • e ⇔ ë, è, é
  • i ⇔ ï, ì, í
  • o ⇔ ö, ò, ó
  • u ⇔ ü, ù, ú

Multi-lettera

In alcuni tipi di carattere l'approccio multi-lettera ha molto successo.

  • a ⇔ ci
  • d ⇔ cl
  • g ⇔ cj
  • m ⇔ rn
  • A ⇔ fi
  • W ⇔ VV

Imprese

Costruisci un singolo personaggio da più personaggi. Molto popolare è vv invece di w.

  • A ⇔ / \
  • B ⇔ | 3
  • D ⇔ |)
  • G ⇔ (¬
  • H ⇔ | - |
  • K ⇔ | & lt ;, | {
  • L ⇔ | _
  • M ⇔ | v |
  • N ⇔ | \ |
  • V ⇔ \ /

Iniezioni

L'iniezione comporta l'inserimento di caratteri privi di significato in una stringa, specialmente all'interno di un dominio / url.

link link

Gli spazi bianchi sono spesso trascurati in questo caso. Zero Width Whitespace (& # 8203;) è uno strumento piacevole in alcune circostanze.

    
risposta data 27.06.2016 - 15:44
fonte

Leggi altre domande sui tag