How does Google ' s” No Captcha reCaptcha ” work?
Esta não é realmente uma grande questão para o stackexchange como o Google está mantendo seus algoritmos secretos, então tudo o que podemos fazer é dar palpites sobre como ele funciona, mas meu entendimento é que o novo sistema irá analisar a sua atividade em todos os serviços do Google (e, possivelmente, outros sites que o Google tem algum controle sobre, como sites que têm anúncios do Google).,
assim, é provável que as verificações não se limitem apenas à página que tem a checkbox nela. Por exemplo, se eles detectarem que o seu endereço de computador/IP que está a usar também foi usado no passado para fazer coisas que um humano normal faria – coisas como verificar o Gmail, pesquisar no Google search, enviar ficheiros para conduzir, partilhar fotografias, navegar na web, etc. – então pode provavelmente ser razoavelmente certo que você é um humano e permitir que você pular a verificação da imagem., Por outro lado, se ele não pode associar seu computador com qualquer atividade humana anterior, então seria mais suspeito e dar-lhe a verificação da imagem. Embora o comportamento do mouse como ele clica a checkbox pode ser um fator que ele analisa, há quase certamente muito mais para ele.mais uma vez, não sabemos ao certo como funciona. Este é apenas o meu melhor palpite baseado no que o pequeno Google disse:
enquanto a nova re API pode parecer simples, há um alto grau de sofisticação por trás dessa caixa de cheques modesta., s há muito tempo dependem da incapacidade dos robôs para resolver texto distorcido. No entanto, nossa pesquisa recentemente mostrou que a tecnologia de Inteligência Artificial de hoje pode resolver até mesmo a variante mais difícil do texto distorcido com 99,8% de precisão. Assim, o texto distorcido, por si só, já não é um teste confiável.
para contrariar isso, no ano passado desenvolvemos um backend avançado de Análise de risco para re que considera ativamente todo o envolvimento de um usuário com o —antes, durante e depois—para determinar se esse usuário é um ser humano., Isso nos permite confiar menos em Escrever texto distorcido e, por sua vez, oferecer uma melhor experiência para os usuários. Falamos sobre isso no nosso post Do Dia Dos Namorados no início deste ano.
para mim o ponto sobre “antes, durante e após o uso” é uma forte dica de que eles analisam o comportamento de navegação anterior, mas a minha interpretação pode estar errada.,
Aqui”está uma citação de WIRED:
em vez de depender do tradicional teste distorcido da palavra, o “re” do Google examina sugestões que cada usuário fornece involuntariamente: endereços IP e cookies fornecem provas de que o Usuário é o mesmo amigável humano que o Google lembra de outros lugares na Web. E Shet diz que mesmo os pequenos movimentos que o mouse de um usuário faz à medida que ele paira e se aproxima de uma caixa de cheques pode ajudar a revelar um bot automatizado.,
quanto à verificação da imagem, você”não será capaz de encontrar essas imagens com pesquisa reversa da imagem, ou compilar uma base de dados delas. Eles são geralmente sinais de rua aleatórios ou números de casa capturados por carros de vista de Rua do Google, ou palavras de livros que foram digitalizados para o projeto Google Books. Há um bom propósito por trás disso-o Google realmente faz uso do que as pessoas digitam em re para melhorar suas próprias bases de dados e treinar algoritmos de OCR., re dá a mesma imagem para um número de usuários, e se todos eles concordam com o que diz, então a imagem se torna dados de treinamento para a IA do Google.
da Wikipédia:
o re service fornece páginas web assinantes com imagens de palavras que o software de reconhecimento óptico de caracteres (OCR) não foi capaz de ler. Os sites subscritores (cujos propósitos são geralmente não relacionados com o projeto de digitalização de livros) apresentam estas imagens para os seres humanos decifrarem como palavras, como parte de seus procedimentos normais de validação., Eles então retornam os resultados para o serviço de re, que envia os resultados para os projetos de digitalização.
re trabalhou na digitalização dos arquivos do New York Times e livros do Google Books. A partir de 2012, trinta anos do New York Times foram digitalizados e o projeto planejado para ter concluído os anos restantes até o final de 2013. O arquivo agora completo do New York Times pode ser pesquisado a partir do New York Times Article Archive, onde mais de 13 milhões de artigos no total foram arquivados, datando de 1851 até os dias atuais.