Internet

Por Filipe Garrett, para o TechTudo


O reCAPTCHA é uma tecnologia do Google que se faz presente em sites e aplicativos comuns na vida dos usuários. Páginas de lojas, aplicativos como o Caixa Tem, NuBank, sites de redes como Pinterest, Zoom ou fóruns e grupos de suporte estão entre alguns dos exemplos de espaços que aplicam a ferramenta. O objetivo é limitar o acesso e tráfego criado por bots e outros tipos de robôs que vasculham a Internet todos os dias gerando tráfego artificial, disparando spams e produzindo ataques. Confira, na lista a seguir, todos os detalhes sobre a ferramenta reCAPTCHA e como utilizá-la.

Função do reCAPTCHA é dificultar a ação de robôs pela Internet — Foto: Divulgação/Google

Quer comprar celular, TV e outros produtos com desconto? Conheça o Compare TechTudo

O que é reCAPTCHA?

O reCAPTCHA é um serviço de CAPTCHA atualmente mantido pelo Google e que consiste em uma aplicação do teste de Turing: um desafio de simples solução por humanos, mas que se mostra insolúvel, ou muito difícil de resolver, por um computador, robô de Internet ou mesmo uma inteligência artificial.

A principal utilidade do reCAPTCHA, bem como de outros sistemas parecidos, é a de filtrar tráfego em websites e apps, impedindo que softwares que vasculham a Internet criem tráfego artificial ou mesmo sobrecarreguem um serviço, tornando o seu acesso mais difícil por usuários reais. Essa preocupação se faz necessária, pois a Internet é cheia dos chamados crawlers, e outros softwares automatizados, encarregados de vasculhar e indexar conteúdo de forma automática, acessando milhares de páginas por segundo. A medida impede spam, torna a Internet mais segura e aumenta a eficiência de sites do mundo todo.

Versão original da tecnologia era usada para identificar palavras em jornais e livros antigos digitalizados — Foto: Divulgação/Google

O termo CAPTCHA é, na verdade, uma sigla em inglês para “Teste de Turing Público Completamente Automático para Diferenciar Humanos e Computadores”. O teste foi criado em 2003, pelo então doutorando guatemalteco Luis Von Ahn, como uma medida para impedir que robôs de Internet criassem contas de e-mail falsas para disparar spam. Na época, ele consistia em uma série de caracteres destorcidos que o usuário precisava identificar sozinho.

Com o tempo, Ahn percebeu que o esforço conjunto de milhões de pessoas identificando caracteres poderia ser direcionado para algo útil além da segurança. Com isso, foi criado o reCAPTCHA que passava a mostrar palavras escaneadas de jornais antigos e livros que não eram facilmente reconhecidas por computador. Cada vez que um número grande de usuários identificava determinada palavra corretamente, esse esforço tornava possível a digitalização de documentos importantes, acervos centenários de jornais como o The New York Times ou obras literárias fruto de processos de impressão mais imprecisos e precários.

Veja também: Quatro coisas que você nunca deve postar nas redes sociais

Quatro coisas que você nunca deve postar nas redes sociais

Quatro coisas que você nunca deve postar nas redes sociais

Em 2011 pelo menos 100 milhões de palavras foram corretamente identificadas e digitalizadas por dia. Com o tempo, para aumentar a acessibilidade, a ferramenta passaria a contar com áudio para pessoas com problemas de visão, ou ainda configurações para auxílio de daltônicos.

Na sua forma atual, o reCAPTCHA, que foi vendido ao Google em 2009, usa imagens obtidas do Google Street View e testa o visitante de um site ou app que precisa identificar, ou assinalar corretamente, elementos dentro da imagem, como chaminés, montanhas, entre outros.

O que significa reCAPTCHA?

Ideia do teste é criar um exercício que determina se o usuário é real ou um robô — Foto: Reprodução/Google

O termo "CAPTCHA" tem referência à ideia de teste de Turing para separar robôs e computadores de usuários reais. Não há uma explicação oficial a respeito do “re”, mas acredita-se que o novo nome tem relação com “re” de “reverso” (“reverse”, em inglês), fazendo referência à ideia de que o reCAPTCHA é um teste de Turing reverso porque, ao contrário do que Turing sugerira, o CAPTCHA é um exercício que o computador usa para testar humanos.

Uma forma de separar uma coisa da outra são os próprios testes: os exercícios de identificação de palavras faziam parte do CAPTCHA (e já não são mais oferecidos pelo Google). Já as versões com imagens, com a caixinha de seleção "eu não sou um robô" e com o CAPTCHA oculto na página fazem parte da fase reCAPTCHA.

O que fazer quando o reCAPTCHA não aparece ou não funciona?

A mensagem "reCAPTCHA inválido" fez parte da rotina de muita gente que tentou acessar as primeiras versões do Caixa TEM — Foto: Rubens Achilles/TechTudo

Em grande parte dos casos, a falha em carregar o teste, ou em ter sua resposta reconhecida, tem a ver com problemas de conexão com a Internet como sinal instável e conexão lenta, ou sobrecarregada. O inverso desse raciocínio também é válido: o Caixa Tem, da Caixa Econômica Federal, aplicou a tecnologia de reCAPTCHA no esforço de filtrar o grande volume de acessos e muita gente se deparou com o “reCAPTCHA inválido” ao tentar acessar o app.

Nesse cenário, o reCAPTCHA acabou inválido em virtude do fato de que o volume de requisições do teste era tão alto que os servidores responsáveis por gerar e conferir resultados das tentativas de acesso de cada usuário não tinham capacidade de dar conta do volume de pedidos. Em uma situação parecida, mesmo com Internet de alta velocidade e estável, e respondendo corretamente ao teste, era bem possível que seu reCAPTCHA retornasse como inválido.

Como funciona o reCAPTCHA do Google?

Versões mais recentes do reCAPTCHA buscam reduzir a "fricção" no uso da Internet, diminuindo as interrupções no fluxo de navegação dos usuários — Foto: Divulgação/Google

Há diferentes versões do reCAPTCHA que aplicam testes e operam de formas diversas. A mais simples é aquela que pede para você identificar fotos em um mosaico com nove imagens diferentes. A partir da identificação correta dos elementos pedidos pelo teste, o sistema reconhece que você é uma pessoa de verdade e libera seu acesso. Caso você falhe no teste, o sistema assume que você é um robô e reinicia o processo, com outra questão e um conjunto de novas imagens.

Uma forma diferente de aplicar o teste, e considerada mais eficiente por ser menos disruptiva no fluxo de navegação por um site, é apresentar uma caixa com “eu não sou um robô” em que você precisa marcar um checkbox. O resultado desse teste é gerado a partir de um conjunto de métricas relacionadas ao seu comportamento na página. Caso esses dados não sejam suficientes, o reCAPTCHA pode ainda pedir que você identifique imagens.

Nesses dois modelos, o reCAPTCHA causa algo que o Google chama de fricção na sua experiência de uso de um determinado site. Por conta disso, os técnicos da gigante das buscas criaram o reCAPTCHA v3. Com a ferramenta, a tecnologia analisa todo o seu comportamento pelas páginas em que está acionada e nunca emite testes para você resolver. Segundo o Google, esse é o reCAPCTHA ideal, já que é menos disruptivo. Há críticos, no entanto, que levantam questões importantes a respeito da privacidade dos usuários, já que a técnica monitora o comportamento individual de cada visitante na página.

É possível desativar ou burlar o reCAPTCHA?

Existem técnicas e estudos que mostram que é possível driblar a ferramenta — Foto: Divulgação/Google

Qualquer problema computacional, com um número finito de respostas pode ser eventualmente resolvido por um computador. Há casos de especialistas em segurança e acadêmicos que, ao longo dos anos, vêm demonstrando vulnerabilidades no sistema e aplicando técnicas que podem superar a ferramenta e engana-la.

Em 2019, por exemplo, um grupo de pesquisadores da Universidade de Louisiana, nos Estados Unidos, divulgaram os resultados de um estudo que produziu um software que seria capaz de responder corretamente 92,4% dos reCAPTCHAs com imagens, além de uma média de tempo de 14,86 segundos no esforço de derrotar o “você é um robô”. Se usado offline, o sistema tem performance ainda melhor, com 95% de acertos na detecção de imagens e tempo médio de cinco segundos para enganar o “você é um robô”.

Como colocar o reCAPTCHA em um site?

Área de desenvolvedores do Google tem instruções e documentação completa de como usar o reCAPTCHA no seus site — Foto: Reprodução/Filipe Garrett

Implementar o reCAPTCHA no seu website, ou app, é relativamente simples e mesmo desenvolvedores com pouca experiência devem ser capazes de colocar a funcionalidade para testes em pouco tempo.

A área para desenvolvedores do Google conta com documentação completa a respeito da implementação da tecnologia, inclusive com amostras de código prontinhas para rodar. O processo, de forma resumida, envolve marcar o recurso com uma tag específica no código HTML do site, além de implementar um snippet em JavaScript responsável pela renderização do componente na página, bem como o processo de realização dos testes e checagem de resultados. Também é possível encontrar um exemplo com código pronto de uso do reCAPTCHA numa sequência de carregamento da página.

Problemas para baixar atualizações na Google Play Store? Veja como resolver no Fórum do TechTudo

Mais do TechTudo