¿cómo funciona Google' s» No Captcha reCaptcha»?

0 Comments

esto no es realmente una gran pregunta para stackexchange, ya que Google mantiene sus algoritmos en secreto, por lo que todo lo que podemos hacer es adivinar cómo funciona, pero entiendo que el nuevo sistema analizará su actividad en todos los servicios de Google (y posiblemente otros sitios sobre los que Google tiene cierto control, como sitios web que tienen anuncios de Google).,

por lo tanto, es probable que las comprobaciones no se limiten solo a la página que tiene la casilla de verificación en ella. Por ejemplo, si detectan que su computadora / dirección IP que está utilizando también se usó en el pasado para hacer cosas que haría un ser humano normal, cosas como revisar Gmail, buscar en la búsqueda de Google, cargar archivos en la unidad, compartir fotos, navegar por la web, etc. – entonces probablemente puede estar razonablemente seguro de que usted es un ser humano y le permite omitir la verificación de la imagen., Por otro lado, si no puede asociar su computadora con ninguna actividad humana anterior, entonces sería más sospechoso y le daría la verificación de la imagen. Aunque el comportamiento del ratón al hacer clic en la casilla de verificación puede ser un factor que analiza, Es casi seguro que hay mucho más.

de nuevo, no sabemos con certeza cómo funciona. Esta es mi mejor suposición basada en lo que poco Google ha dicho:

mientras que la nueva re API puede sonar simple, hay un alto grado de sofisticación detrás de esa casilla de verificación modesta., s han confiado durante mucho tiempo en la incapacidad de los robots para resolver texto distorsionado. Sin embargo, nuestra investigación mostró recientemente que la tecnología de Inteligencia Artificial de hoy en día puede resolver incluso la variante más difícil de texto distorsionado con una precisión del 99,8%. Por lo tanto, el texto distorsionado, por sí solo, ya no es una prueba confiable.

para contrarrestar esto, el año pasado desarrollamos un backend de análisis de riesgo avanzado para re que considera activamente todo el compromiso de un usuario con el —antes, durante y después—para determinar si ese usuario es un humano., Esto nos permite confiar menos en escribir texto distorsionado y, a su vez, ofrecer una mejor experiencia para los usuarios. Hablamos de esto en nuestro post del día de San Valentín a principios de este año.

para mí, el punto sobre «antes, durante y después del uso» es un fuerte indicio de que analizan el comportamiento de navegación anterior, pero mi interpretación podría ser incorrecta.,

Aquí hay una cita de WIRED:

en lugar de depender de la tradicional prueba de palabras distorsionadas, el» re » de Google examina las señales que cada usuario proporciona inconscientemente: las direcciones IP y las cookies proporcionan evidencia de que el Usuario es el mismo humano amigable que Google recuerda de otro lugar en la Web. Y Shet dice que incluso los pequeños movimientos que hace el mouse de un usuario a medida que se desplaza y se acerca a una casilla de verificación pueden ayudar a revelar un bot automatizado.,

en cuanto a la verificación de imágenes, no podrá encontrar esas imágenes con la búsqueda inversa de imágenes, ni compilar una base de datos de ellas. Por lo general, son señales de calle al azar o números de casas capturados por Google»s Street View cars, o palabras de libros que fueron escaneados para el proyecto de libros de Google. Hay un buen propósito detrás de esto: Google realmente hace uso de lo que la gente escribe en re para mejorar sus propias bases de datos y entrenar algoritmos de OCR., re da la misma imagen a un número de usuarios, y si todos están de acuerdo en lo que dice, entonces la imagen se convierte en datos de entrenamiento para Google»s AI.

de wikipedia:

El re service suministra a los sitios web suscritos imágenes de palabras que el software de Reconocimiento óptico de caracteres (OCR) no ha podido leer. Los sitios web suscritos (cuyos propósitos generalmente no están relacionados con el proyecto de digitalización de libros) presentan estas imágenes para que los humanos las descifren como palabras, como parte de sus procedimientos normales de validación., Luego devuelven los resultados al servicio re, que envía los resultados a los proyectos de digitalización.

re ha trabajado en la digitalización de los archivos del New York Times y libros de Google Books. A partir de 2012, treinta años de The New York Times se habían digitalizado y el proyecto tenía previsto haber completado los años restantes para finales de 2013. El archivo ahora completado del New York Times se puede buscar en el New York Times Article Archive, donde se han archivado más de 13 millones de artículos en total, que datan de 1851 hasta la actualidad.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *