Comment fonctionne Google ' s » No Captcha reCaptcha »?
ce n’est pas vraiment une excellente question pour stackexchange car Google garde ses algorithmes secrets, donc tout ce que nous pouvons vraiment faire est de faire des suppositions sur la façon dont cela fonctionne, mais je comprends que le nouveau système analysera votre activité sur tous les services de Google (et peut-être d’autres sites sur lesquels Google a un certain contrôle,,
ainsi, il est probable que les vérifications ne se limitent pas à la page qui contient la case à cocher. Par exemple, s’ils détectent que votre ordinateur/adresse IP que vous utilisez a également été utilisé dans le passé pour faire des choses qu’un humain normal ferait – des choses comme la vérification de Gmail, la recherche sur Google search, le téléchargement de fichiers sur Drive, le partage de photos, la navigation sur le web, etc. – ensuite, il peut probablement être raisonnablement sûr que vous êtes un homme et vous permettre d’ignorer la vérification de l’image., D’autre part, s’il ne peut pas associer votre ordinateur à une activité humaine précédente, alors il serait plus suspect et vous donner la vérification de l’image. Bien que le comportement de la souris lorsqu’elle clique sur la case à cocher puisse être un facteur qu’elle analyse, il y a presque certainement beaucoup plus à cela.
encore une fois, nous ne savons pas avec certitude comment cela fonctionne. Ceci est juste ma meilleure estimation basée sur ce que peu Google a dit:
bien que la nouvelle API re puisse sembler simple, il y a un haut degré de sophistication derrière cette case à cocher modeste., s ont longtemps compté sur l’incapacité des robots à résoudre le texte déformé. Cependant, nos recherches ont récemment montré que la technologie D’Intelligence Artificielle d’aujourd’hui peut résoudre même la variante la plus difficile du texte déformé avec une précision de 99,8%. Ainsi, le texte déformé, à lui seul, n’est plus un test fiable.
pour contrer cela, l’année dernière, nous avons développé un backend avancé D’analyse des risques pour re qui prend activement en compte l’ensemble de l’engagement d’un utilisateur avec le —avant, pendant et après—pour déterminer si cet utilisateur est un humain., Cela nous permet de moins compter sur la saisie de texte déformé et, à son tour, offrir une meilleure expérience pour les utilisateurs. Nous en avons parlé dans notre post de la Saint-Valentin plus tôt cette année.
pour moi, le point sur « avant, pendant et après utilisation » est un indice fort qu’ils analysent le comportement de navigation précédent, mais mon interprétation pourrait être fausse.,
Voici une citation de WIRED:
Au Lieu de dépendre du test de mot Déformé traditionnel, le »re « de Google examine les indices que chaque utilisateur fournit involontairement: les adresses IP et les cookies fournissent la preuve que L’utilisateur est le même humain amical que Google se souvient Et Shet dit que même les mouvements minuscules de la souris d’un utilisateur lorsqu’elle plane et s’approche d’une case à cocher peuvent aider à révéler un bot automatisé.,
en ce qui concerne la vérification d’image, vous ne serez pas en mesure de trouver ces images avec la recherche d’image inversée, ou de compiler une base de données d’entre eux. Ce sont généralement des panneaux de rue aléatoires ou des numéros de maison capturés par les voitures Street View de Google, ou des mots de livres qui ont été numérisés pour le projet Google Books. Il y a un bon but derrière cela – Google utilise réellement ce que les gens tapent dans re pour améliorer leurs propres bases de données et former des algorithmes OCR., re donne la même image à un certain nombre d’utilisateurs, et s’ils sont tous d’accord sur ce qu’il dit, alors l’image devient des données de formation pour L’IA de Google.
de wikipedia:
le service re fournit aux sites Web abonnés des images de mots que le logiciel de Reconnaissance optique de caractères (OCR) n’a pas pu lire. Les sites abonnés (dont les finalités ne sont généralement pas liées au projet de numérisation du livre) présentent ces images à déchiffrer comme des mots, dans le cadre de leurs procédures normales de validation., Ils renvoient ensuite les résultats au service re, qui les envoie aux projets de numérisation.
re a travaillé à la numérisation des archives du New York Times et des livres de Google Books. En 2012, trente années du New York Times avaient été numérisées et le projet prévoyait d’avoir terminé les années restantes d’ici la fin de 2013. Les archives maintenant terminées du New York Times peuvent être recherchées à partir des archives D’articles du New York Times, où plus de 13 millions d’articles au total ont été archivés, datant de 1851 à nos jours.