jak działa Google's „No Captcha reCaptcha”?

0 Comments

to nie jest naprawdę świetne pytanie dla stackexchange, ponieważ Google utrzymuje swoje algorytmy w tajemnicy, więc wszystko, co możemy zrobić, to zgadywać, jak to działa, ale rozumiem, że nowy system będzie analizował Twoją aktywność we wszystkich usługach Google (i ewentualnie innych stronach, nad którymi Google ma pewną kontrolę, takich jak strony internetowe, które mają reklamy Google).,

dlatego jest prawdopodobne, że kontrole nie ograniczają się tylko do strony, na której znajduje się pole wyboru. Na przykład, jeśli wykryją, że Twój komputer/adres IP, którego używasz, był również używany w przeszłości do robienia rzeczy, które zrobiłby normalny człowiek – takich jak sprawdzanie Gmaila, wyszukiwanie w wyszukiwarce Google, przesyłanie plików na dysk, udostępnianie zdjęć, przeglądanie Internetu itp. – wtedy może być prawdopodobnie rozsądnie pewien, że jesteś człowiekiem i pozwoli Ci pominąć weryfikację obrazu., Z drugiej strony, jeśli nie może powiązać komputera z żadną wcześniejszą aktywnością podobną do ludzkiej, byłoby to bardziej podejrzane i umożliwiłoby weryfikację obrazu. Chociaż zachowanie myszy podczas klikania pola wyboru Może być jednym z czynników, które analizuje, prawie na pewno jest o wiele więcej.

ponownie, nie wiemy na pewno, jak to działa. To jest tylko moje najlepsze przypuszczenie na podstawie tego, co powiedział Mały Google:

podczas gdy nowe API re może wydawać się proste, za tym skromnym checkboxem kryje się wysoki stopień wyrafinowania., s od dawna polegają na niezdolności robotów do rozwiązywania zniekształconego tekstu. Jednak nasze badania niedawno wykazały, że dzisiejsza technologia sztucznej inteligencji może rozwiązać nawet najtrudniejszy wariant zniekształconego tekstu z dokładnością 99,8%. W ten sposób zniekształcony tekst, sam w sobie, nie jest już wiarygodnym testem.

aby temu przeciwdziałać, w zeszłym roku opracowaliśmy zaawansowaną analizę ryzyka dla re, która aktywnie bierze pod uwagę całe zaangażowanie użytkownika —przed, w trakcie i po—w celu określenia, czy użytkownik jest człowiekiem., Dzięki temu możemy w mniejszym stopniu polegać na pisaniu zniekształconego tekstu, a tym samym zapewnić użytkownikom lepsze wrażenia. Rozmawialiśmy o tym w naszym walentynkowym poście na początku tego roku.

dla mnie punkt o „przed, w trakcie i po użyciu” jest silną wskazówką, że analizują poprzednie zachowanie przeglądania, ale moja interpretacja może być błędna.,

oto cytat z WIRED:

zamiast polegać na tradycyjnym teście zniekształconych słów, Google”re „analizuje sygnały, które każdy użytkownik nieświadomie dostarcza: adresy IP i pliki cookie dostarczają dowodów na to, że użytkownik jest tak samo przyjazny, jak Google pamięta z innych stron internetowych. A Shet mówi, że nawet drobne ruchy myszy użytkownika, gdy unosi się i zbliża się do pola wyboru, mogą pomóc ujawnić zautomatyzowanego bota.,

jeśli chodzi o weryfikację obrazów, nie będziesz mógł znaleźć tych obrazów za pomocą odwrotnego wyszukiwania obrazów lub skompilować ich bazy danych. Są to zwykle losowe znaki uliczne lub numery domów przechwycone przez samochody Street View Google lub słowa z książek, które zostały zeskanowane dla projektu Google Books. Jest to dobry cel-Google faktycznie wykorzystuje to, co ludzie wpisują do re, aby ulepszyć własne bazy danych i szkolić algorytmy OCR., re daje ten sam obraz do wielu użytkowników, a jeśli wszyscy zgadzają się na to, co mówi, a następnie obraz staje się dane treningowe dla Google ” s AI.

Z Wikipedii:

usługa re dostarcza subskrybującym strony internetowe obrazy słów, których oprogramowanie do optycznego rozpoznawania znaków (OCR) nie było w stanie odczytać. Strony internetowe subskrybujące (których cele są na ogół niezwiązane z projektem digitalizacji książek) prezentują te obrazy, aby ludzie mogli je odszyfrować jako słowa, jako część ich normalnych procedur walidacji., Następnie zwracają wyniki do serwisu re, który wysyła wyniki do projektów digitalizacji.

re pracował nad digitalizacją archiwów The New York Times i książek z Google Books. W 2012 roku trzydziestu lat New York Times został zdigitalizowany, a projekt zaplanowano zakończyć pozostałe lata do końca 2013 roku. Obecnie ukończone archiwum New York Times można przeszukiwać z New York Times Article Archive, gdzie w sumie ponad 13 milionów artykułów zostało zarchiwizowanych, począwszy od 1851 do dnia dzisiejszego.


Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *