Attualmente lavoro come stagista estivo.
Il mio primo obiettivo è, dato un insieme di file, recuperare e identificare i tipi di file presenti in esso.
Per scaricare dati pseudo-forensi di esempio che ho utilizzato: Digital Corpora
Per recuperare i file ho usato ' The Sleuthkit ' ma questo non sembra funzionare come ho sempre messaggi di errore riguardo al formato dei dati utilizzati.
Sarebbe fantastico ricevere suggerimenti / collegamenti a tutorial o software che aiutano a recuperare i dati.
Non vedo l'ora di link per scaricare psuedo dati forensi simili a quelli sopra.
In particolare, vorrei recuperare tutti i dati che sono in formati di testo (parola, pdf, email, html ... ecc.) quindi unificarlo in un singolo file in formato testo e quindi utilizzare l'elaborazione del linguaggio naturale per determinare i luoghi il persona era associata con. Ho alcune idee per quanto riguarda l'aspetto di elaborazione del linguaggio naturale del problema, ma ho bisogno di aiuto per quanto riguarda il recupero dei dati. Il modo migliore per fare questo compito.