Siti che consentono il contenuto generato dall'utente

4

C'è un modo per identificare quali siti popolari ospiteranno contenuti arbitrari generati dagli utenti?

Sto facendo delle analisi per rilevare i siti di phishing. Sarebbe bello usare la popolarità di un sito web come un modo per eliminare i siti che, molto probabilmente, non sono siti di phishing. Ad esempio, è improbabile che Google.com e Amazon.com stiano ospitando un sito di phishing. Pertanto, siti molto popolari potrebbero essere considerati attendibili. Tuttavia, la popolarità non è un proxy perfetto per la fiducia, se alcuni siti popolari consentono di ospitare contenuti utente arbitrari. Ad esempio, Wordpress.com, Github.io, Googleusercontent.com e Wix.com probabilmente non dovrebbero essere considerati attendibili, perché ospitano contenuti generati dagli utenti e quindi potrebbero essere utilizzati per ospitare un attacco di phishing.

C'è un modo per ottenere un elenco di tali siti? Mi interessa solo per i siti più popolari (ad esempio, Alexa top 1000 o giù di lì). Esistono servizi di reputazione del sito web o di affidabilità che forniscono queste informazioni?

    
posta D.W. 21.03.2016 - 05:42
fonte

2 risposte

1

Al livello più elementare: no. Qualsiasi sito può scegliere di ospitare qualsiasi contenuto e avere diversi livelli di igiene dei contenuti generati dagli utenti e vari livelli di sicurezza. Persino Google dispone di servizi che potrebbero essere utilizzati per il phishing, indipendentemente da quanto possa essere difficile farlo effettivamente. Anche se un sito non lo consente, ci sono attacchi, come l'avvelenamento DNS, l'iniezione SQL, gli attacchi di escalation e così via, che potrebbero lasciare un sito normalmente protetto in uno stato dannoso. Anche il sito Web della NASA è stato hackerato una volta, e avrebbe potuto causare molti danni se gli hacker avessero voluto farlo.

    
risposta data 21.03.2016 - 08:31
fonte
0

La ricerca per capire meglio, documentare e proteggere dal phishing è ovviamente auspicabile, ma vorrei ricordare la risposta precedente che al livello dominio è probabilmente impossibile senza fare analisi del contenuto, perché equivale a per dimostrare un negativo, informazioni complete per le quali non esiste.

La presenza o l'assenza di contenuti generati dagli utenti nei contenuti forniti da un'azienda comporta disposizioni aggiuntive in una politica sulla privacy, in particolare per citare le leggi che proteggono le imprese dalle tutele basate sul contenuto creato dagli utenti che non rappresenta la politica dell'azienda .

È probabilmente possibile analizzare un corpus di politiche sulla privacy e determinare quali suggeriscono la presenza di contenuti generati dagli utenti, ma che si riferiscono solo alle aziende, non ai domini.

La generazione di un elenco completo di domini e sottodomini in possesso di un'azienda è un'arte, in quanto tali informazioni non sono espressamente pubbliche e devono essere indovinate o dedotte. Nel contesto di un dominio specifico, una determinata politica può essere applicata a molti domini in possesso dell'azienda che sono in ultima analisi responsabili per la politica e non necessariamente si applicano specificamente al dominio in cui è ospitata.

Quindi si potrebbe dire che c'è UGC da qualche parte su questi domini X di proprietà dell'azienda Y, perché la politica sulla privacy ha detto così, ma non esiste una politica per determinare che UGC sia solo sul dominio A e non su B.

I domini stessi rappresentano i confini di fiducia con i browser, e per quei domini che partecipano, è possibile effettuare alcune analisi per determinare quali risorse aggiuntive sono considerate all'interno del cerchio di fiducia stabilito dal dominio. Così, per esempio, molti domini "fidano" di jquery o di altri siti di hosting javascript di terze parti, il che significa che questi siti diventano bersagli per il dirottamento di distribuire malware o phishing. Ma questo stesso non si associa alla presenza o all'assenza di contenuti generati dagli utenti.

Molti siti di traffico di annunci pubblicitari, che sono un importante veicolo di phishing e malware. Si può anche eseguire la scansione approfondita di un sito per determinare se serve annunci, ma se determina che un bot è in visita, potrebbe decidere di non consegnare tag annuncio a quel particolare client perché così avrà un impatto sulle metriche importanti per la pubblicazione degli annunci e le entrate .

I siti di phishing possono essere nascosti dietro strati di accorciatori di URL, e questi possono anche prendere decisioni in tempo reale su quale link fornire a quale visitatore, quindi anche la presenza di link in UGC non è necessariamente un indicatore semplice.

Infine, nel contesto della popolarità- google.com ASSOLUTAMENTE può ospitare contenuti di phishing, perché i contenuti generati dagli utenti vengono restituiti nei risultati di ricerca pubblicati nel dominio google.com.

    
risposta data 17.09.2016 - 17:19
fonte

Leggi altre domande sui tag