L'FBI attualmente stampa e redatta documenti usando meccanismi analogici. Sono curioso di sapere se qualcuno ha mai studiato l'accuratezza di dedurre le possibili parole o nomi. Certamente, data la larghezza statica dei caratteri nel set di caratteri a larghezza variabile, lo spazio limitato disponibile e la probabilità di sequenze di caratteri, questo dovrebbe essere fattibile.
- Credo che questo fosse il documento originale
- Credo che questo documento sia stato riallineato per gli scopi dell'OCR
Ecco uno snippet dal documento preso da pagina 61.
Snippetread,
(U//LES)Anidentified'<REDACTED>'asofOctoberplannedtoengageinsniperattacksagainstprotestorsinHouston,Texas,ifdeemednecessary.Anidentified'<REDACTED>'hadreceivedintelligencethatindicatedtheprotestersinNewYorkandSeattleplannedsimilarprotestsinHouston,Dallas,SanAntonio,andAustin,Texas.'<REDACTED>'plannedtogatherintelligenceagainsttheleadersoftheprotestgroupsandobtainphotographs,thenformulateaplantokilltheleadershipviasuppressedsniperrifles.(Note:protestscontinuedthroughouttheweekendwithapproximately6000personsinNYC."Occupy Wall Street" protests have spread to about half of all states in the US, over a
dozen European and Asian cities, including protests in Cleveland 10/6-8/11 at Willard Park which was
initially attended by hundreds of protestors).
Questo piccolo frammento copre i caratteri latini,
"(),-./0168:<>ACDEHLNOPRSTUWYabcdefghiklmnoprstuvwxyze
Sono sicuro che anche gli altri possono essere presi dal documento.
Ho preso le ultime poche righe (che non hanno alcuna redazione) e le ho sovrapposte con una copia dello stesso testo in Times New Roman . Sono convinto che il font sia Times New Roman, ma che la scansione sia errata o che sia stato fatto qualcosa per oscurare l'allineamento.
Questainteravulnerabilitàsibasasugrafemialarghezzavariabile.Dovemolteparolepossonoesseresqualificateperlamancanzadicoerenzaealtreperladimensionedellorocaratterecostituente.Conicaratterialarghezzavariabileognigrafemahalapropriadimensioneementrecisonocertamentecollisionipensochepossanofaremoltoperriempireglispazivuoti.Eccodueparoledisettelettere,adesempio:possiamovederecheunadiesseèsostanzialmentepiùgrande:
Guardando comunque al anticipo per Times New Roman, non sono sicuro di quanto sarebbe utile.
"512" : "."
"569" : "ijlt"
"682" : "-frI"
"797" : "sJ"
"909" : "acez"
"1024" : "bdghknopquvxy0123456789"
"1139" : "FPS"
"1251" : "ELTZ"
"1366" : "BCR"
"1479" : "wADGHKNOQUVXY"
"1593" : "m"
"1821" : "M"
"1933" : "W"
Possiamo vedere qui nella classe di caratteri [A-Za-z0-9.-]
ci sono 13 diverse lunghezze possibili.