Come funziona "No Captcha reCaptcha" di Google?

59

Google ha rilasciato una nuova forma di identificazione captcha dei bot, che chiede all'utente di fare clic su una singola casella di controllo. Utilizza la verifica basata su immagini solo se necessario.

Qualcuno potrebbe spiegarmi come questo programma distingue un essere umano da un bot?

C'è un programma qui che può fare clic con il mouse sul tuo computer. Non può essere rilevato da un programma basato sul Web senza accesso ai file del programma. Dovrebbe essere possibile scrivere un eseguibile di Windows non rilevabile che può spuntare la casella di controllo. Si potrebbe anche randomizzare il tempo di risposta del programma.

Dopo alcuni tentativi (riusciti), il captcha chiederà la verifica dell'immagine. Forse ciò può essere risolto da un'IA che cerca le immagini usando Google Image Search (per immagine) e fa ipotesi basate sui nomi di file di immagini "visivamente simili". Se le immagini utilizzate non sono dalla rete, allora sarebbero limitate in numero e si potrebbe creare un database di esse.

Qualcuno potrebbe chiarire se questi approcci potrebbero effettivamente funzionare?

    
posta ghosts_in_the_code 09.01.2015 - 18:37
fonte

4 risposte

47

Questa non è davvero una grande domanda per stackexchange dato che Google mantiene segreti i suoi algoritmi, quindi tutto ciò che possiamo veramente fare è fare ipotesi su come funziona, ma la mia comprensione è che il nuovo sistema analizzerà la tua attività su tutti i Google servizi (e probabilmente anche altri siti su cui Google ha un certo controllo, come i siti web che dispongono di annunci Google).

Pertanto, è probabile che i controlli non siano limitati solo alla pagina che contiene la casella di controllo. Ad esempio, se rilevano che il tuo computer / indirizzo IP che utilizzi è stato utilizzato anche in passato per fare cose che un normale umano farebbe: cose come controllare Gmail, cercare su Ricerca Google, caricare file su Drive, condividere foto, navigare il web ecc. - allora probabilmente può essere ragionevolmente sicuro che tu sia un essere umano e permetterti di saltare la verifica dell'immagine. D'altra parte, se non è in grado di associare il tuo computer a precedenti attività di tipo umano, sarebbe più sospetto e ti darà la verifica dell'immagine. Anche se il comportamento del mouse mentre fa clic sulla casella di controllo potrebbe essere un fattore analizzato, ci sono quasi sicuramente molto di più.

Ancora una volta, non sappiamo con certezza come funzioni. Questa è solo la mia ipotesi migliore basata su quel poco che Google ha detto:

While the new reCAPTCHA API may sound simple, there is a high degree of sophistication behind that modest checkbox. CAPTCHAs have long relied on the inability of robots to solve distorted text. However, our research recently showed that today’s Artificial Intelligence technology can solve even the most difficult variant of distorted text at 99.8% accuracy. Thus distorted text, on its own, is no longer a dependable test.

To counter this, last year we developed an Advanced Risk Analysis backend for reCAPTCHA that actively considers a user’s entire engagement with the CAPTCHA—before, during, and after—to determine whether that user is a human. This enables us to rely less on typing distorted text and, in turn, offer a better experience for users. We talked about this in our Valentine’s Day post earlier this year.

Per me il punto su "prima, durante e dopo l'uso" è un strong suggerimento che analizzano il precedente comportamento di navigazione, ma la mia interpretazione potrebbe essere sbagliata.

Ecco una citazione da WIRED:

Instead of depending upon the traditional distorted word test, Google’s “reCaptcha” examines cues every user unwittingly provides: IP addresses and cookies provide evidence that the user is the same friendly human Google remembers from elsewhere on the Web. And Shet says even the tiny movements a user’s mouse makes as it hovers and approaches a checkbox can help reveal an automated bot.

C'è un altro thread su StackOverflow che discute anche di questo: link

Per quanto riguarda la verifica delle immagini, non sarai in grado di trovare quelle immagini con la ricerca inversa delle immagini o di compilare un loro database. Di solito sono segnali stradali casuali o numeri civici catturati dalle auto di Google Street View o parole di libri scansionati per il progetto Google Libri. C'è un buon scopo alla base di questo: Google utilizza effettivamente ciò che le persone digitano in reCaptcha per migliorare i propri database e addestrare gli algoritmi OCR. reCaptcha fornisce la stessa immagine a un numero di utenti e, se tutti sono d'accordo su ciò che dice, l'immagine diventa dati di allenamento per l'intelligenza artificiale di Google.

Da wikipedia:

The reCAPTCHA service supplies subscribing websites with images of words that optical character recognition (OCR) software has been unable to read. The subscribing websites (whose purposes are generally unrelated to the book digitization project) present these images for humans to decipher as CAPTCHA words, as part of their normal validation procedures. They then return the results to the reCAPTCHA service, which sends the results to the digitization projects.

reCAPTCHA has worked on digitizing the archives of The New York Times and books from Google Books.[3] As of 2012, thirty years of The New York Times had been digitized and the project planned to have completed the remaining years by the end of 2013. The now completed archive of The New York Times can be searched from the New York Times Article Archive, where more than 13 million articles in total have been archived, dating from 1851 to the present day.

    
risposta data 09.01.2015 - 19:11
fonte
11

Anche io uso di essere stupito da questa cosa. Quindi, cosa ho fatto, in Chrome apri la modalità di navigazione in incognito, quindi sfoglia un sito che ha il nuovo Google CAPTCHA e spunta la casella. Beh, non mi ha aiutato, invece mostra una serie di immagini e mi ha chiesto di selezionare le immagini relative a un'immagine.

Questo dimostra che Google monitora costantemente il nostro comportamento per determinare se siamo umani o meno.

    
risposta data 05.10.2015 - 12:36
fonte
4

Quando fai clic su Non sono un robot invia una richiesta HTTP a google con tutta una serie di informazioni utili come

  • Il tuo indirizzo IP
  • Il tuo Paese
  • Timestamp

Informazioni dal tuo browser come il modo in cui muovi il cursore prima di entrare nella casella di controllo. Come stai scorrendo la pagina prima del clic. L'intervallo di tempo tra diversi eventi del browser e molte altre variabili che Google mantiene segrete.

Tutti questi criteri vengono quindi elaborati dall'analisi del rischio di apprendimento automatico su Google e la maggior parte delle volte le informazioni possono indicare la differenza tra un umano e un robot, ma se il motore di analisi del rischio è ancora incerto, la piccola percentuale degli utenti spesso completa una sfida aggiuntiva.

Ecco dove entra CAPTCHA di riconoscimento delle immagini . Se provi di essere umano in questo modo, è probabile che il motore di Google si ricorderà e la prossima volta che fai clic su tale casella sarai in grado di passare questi.

    
risposta data 11.03.2017 - 20:57
fonte
0

Fa diverse cose. Controlla il tuo indirizzo IP e i cookie. Guarda come fai clic e il tuo mouse si muove prima di fare clic. Usando uno strumento auto click usaly fa sì che google ti dia un'immagine.

    
risposta data 11.03.2017 - 03:10
fonte

Leggi altre domande sui tag