Topo

Tecnologia

A tecnologia por trás...


Eu não sou robô: como sites e apps descobrem se você é humano (não um bot)

Getty Images
Robôs que substituem pessoas e fingem ser seres humanos não são raridade na internet Imagem: Getty Images

Helton Simões Gomes

Do UOL, em São Paulo

2019-02-21T04:00:00

21/02/2019 04h00

Resumo da notícia

  • O acesso massivo de robôs a sites e apps é um problema antigo na internet
  • Barrar essas máquinas é difícil, já que elas são especialistas em imitar humanos
  • 'Caçadores de máquinas' fazem perguntas, mas não analisam só respostas corretas
  • Essas ferramentas, como o captcha, averiguam também o seu comportamento online

Não é de hoje que as máquinas estão à solta pela internet. Tanto é que você já deve ter topado com sites e apps perguntando se você é um robô. O que você talvez não saiba é o seguinte: a resposta não importa tanto, o que conta mesmo é como você responde à pergunta.

Há ferramentas que tentam atestar se um internauta é de carne e osso e não um programinha de computador criado executar tarefas automatizadas. E o que elas querem mesmo é saber se você tem o comportamento de um ser humano e não apenas se você dá a resposta certa.

Como fazem isso? Conferindo o jeito como você usa o mouse ou seu histórico de navegação na internet. Mas não saia espalhando essa informação por aí, humano: as máquinas estão evoluindo para se tornar cada vez mais parecidas com você.

Diogo Cortiz, pesquisador do Centro de Estudos sobre Tecnologias Web (Ceweb.br), explica que os robôs se espalharam quando a internet passou a ser usada para fazer microtransações, sejam votações online, contagens de visitas ou solicitações de informações. Programadores escreviam códigos destinados a burlar esses recursos, ou seja, falsificar votos, visitas e pedidos. Hoje em dia, há resenhas de produtos, perfis em redes sociais e até compras feitas por robôs.

No começo dos anos 2000, as soluções que barram essas ações automatizadas passaram a ser chamadas de CAPTCHA, um acrônimo em inglês para "Teste de Turing completamente automatizado para distinguir computadores de máquinas". A paternidade da ideia do captcha é contestada, mas há duas certezas por trás dessa ideia.

Uma é o tal do teste de Turing citado aí em cima. Ele foi criado por Alan Turing em 1950 para mensurar em que grau as respostas criadas por uma inteligência artificial se assemelhariam às de um ser humano. A ideia aqui é avaliar o nível de complexidade do sistema automatizado. A máquina se sai melhor conforme ela reproduz o jeitinho como a gente se comporta e não de acordo com o número de respostas certas.

Outra certeza é que o termo captcha foi cunhado em 2003 pelos cientistas da computação Manuel Blum, Nicholas J. Hooper e Luis von Ahn - esse último você conhece, já que ele fundou anos depois o app de aprendizado Duolingo.

Como um gênio fez 30 milhões de brasileiros estudarem inglês

O nerd mais pop do Brasil

O surgimento do primeiro captcha, porém, é controverso."Os mais populares eram aqueles para inserir letras ou para informar o resultado de contas, coisas simples como fazer soma, subtração ou multiplicação", diz Cortiz.

O AltaVista, ferramenta de pesquisa na internet dos primórdios da rede, já usava um desses sistemas em 1997 para impedir que robôs incluíssem links em seu motor de buscas. Os criadores do precursor do Google clamam serem os reais pais do captcha. Um dos usos iniciais mais famosos é o do PayPal que, em 2001, implantou uma curiosa forma de impedir fraudes financeiras: os usuários tinham que digitar as letras distorcidas dispostas dentro de uma caixa de texto.

O motivo? A empresa de pagamento estava promovendo uma campanha agressiva para atrair clientes; os novos usuários ganhavam bônus em dinheiro além de render uma recompensa a quem os tivesse levado para a plataforma. Diante da possibilidade de ganhar uma grana, hackers inundaram o PayPal com clientes-robô e geraram um prejuízo gigantesco.

Ainda que você não soubesse dessa história, já deve ter topado com o modelo adotado pelo PayPal. Ele quase virou sinônimo de captcha. Só que os robôs ficaram mais sofisticados e passaram a ser capazes de identificar as letras naquelas caixinhas.

A identificação de acessos automatizados se sofisticou tanto que virou uma preocupação constante da área de desenvolvimento de empresas que dependem da internet. É o caso do Google que, em 2009, comprou a recaptcha, uma empresa fundada por Luis von Ahn para criar sistemas que barravam robôs.

Na época, a recaptcha pedia que usuários identificassem letras retiradas de textos de revistas e jornais - o trabalho de reconhecimento, feito pelos internautas, era usado para digitalizar livros. Só que essa tecnologia evoluiu.

A partir de 2014, o Google lançou uma versão atualizada da ferramenta, que passou a basear sua análise no comportamento dos internautas em vez de se valer da resposta dessas pessoas. Pedia que eles dissessem "eu não sou um robô" e selecionassem imagens que contivessem um elemento específico. Características de como esse sujeito usava aparelhos eletrônicos passaram a contar, como a forma de mexer no mouse ou de digitar no teclado.

Os humanos têm um padrão de uso do mouse que não é de ir certinho clicar na caixa. Ele dá umas tremidas e apresenta oscilações. Já os scripts [robôs] formam linhas de navegação

Diego Cortiz

Só que o recaptcha possui um problema:

Além de questão de segurança, o captcha tem a questão de design, porque ele acaba virando um pedágio. Eu já passei por situações em que ficou difícil de entender e responder ao desafio. O Google percebeu que isso era uma barreira e um impedimento para o usuário.

Para evitar que você corresse evitasse sites que o submetessem a esses desafios, a empresa parou de exibir as caixas "eu não sou um robô" a todo mundo a partir de 2017. Isso, porém, não quer dizer que ela abandonou ferramentas como esta. O Google passou a avaliar as pessoas silenciosamente.

A certificação de que você não é um robô continuou lá, mas a forma como isso é feito é que mudou. Em vez de pedir que você resolvesse desafios, a nova versão do recaptcha passou a analisar os detalhes de como você se comporta na internet para prever a possibilidade de você ser um robô ou não. Um dos fatores averiguados é o seu histórico de navegação.

Os desafios não sumiram completamente: ainda aparece para usuários que apresentem indicativos de serem robôs. Um deles, por exemplo, é uso de VPN, serviços que destinados a, entre outras coisas, esconder a origem de uma conexão.

O recaptcha, porém, não é o único serviço de validação de identidade. Cortiz conta que há outras ferramentas como essas tão poderosas que o comportamento de alguém vira uma verdadeira senha.

Há pesquisas que mostram que em alguns sistemas dá para ceder a senha a outra pessoa que ela não vai conseguir acessar porque identificam o padrão da digitação diferente

Conforme essas plataformas evoluem, golpistas correm para superá-las. E isso gera uma eterna briga de gato e rato. Tanto é que há sistemas para autenticar que não se trata de um robô características comportamentais bastante específicas como a inclinação com que alguém costuma usar o celular ou a pressão com que a tela do aparelho é tocada.