Como um rapaz de 19 anos de Illinois está distorcendo as médias nacionais das pesquisas de intenção de voto

Nate Cohn

  • Jim Young/Reuters

    Imagens dos candidatos presidenciais Hillary Clinton (esq) e Donald Trump são pintadas em abóboras decorativas criadas pelo artista John Kettman em LaSalle (Illinois)

    Imagens dos candidatos presidenciais Hillary Clinton (esq) e Donald Trump são pintadas em abóboras decorativas criadas pelo artista John Kettman em LaSalle (Illinois)

Existe um rapaz negro de 19 anos em Illinois que não faz ideia do peso que está tendo nesta eleição.

Ele tem certeza de que vai votar em Donald Trump.

E ele tem sido usado como prova por conservadores —inclusive veículos como Breitbart News e "The New York Post"— de que Trump está se saindo muito bem entre eleitores negros. Ele até foi parcialmente responsável por mudar índices inteiros de intenção de voto, como a média do RealClearPolitics, favorecendo Trump.

Mas como? Ele é membro de um painel na pesquisa da USC Dornsife/Los Angeles Times Daybreak, que se destacou como a maior anomalia da campanha presidencial. Apesar de estar atrás por uma porcentagem de dois dígitos em algumas sondagens nacionais, Trump em geral liderou a pesquisa do USC/LAT. Ele manteve a liderança durante um mês inteiro até quarta-feira, quando Hillary Clinton assumiu uma liderança nominal.

Nosso amigo em Illinois apoiador de Trump teve um peso surpreendentemente grande nisso. Em algumas pesquisas, ele foi ponderado até 30 vezes mais que o entrevistado médio e até 300 vezes mais que o entrevistado menos ponderado.

Ele sozinho foi suficiente para elevar a dois dígitos a porcentagem de apoio a Trump entre eleitores negros. Ele conseguiu melhorar em 1 ponto a margem de Trump nas pesquisas, ainda que seja somente um dentre cerca de 3 mil membros do painel.

Ele também é o motivo pelo qual Hillary assumiu a liderança na pesquisa da USC/LAT pela primeira vez em um mês na quarta-feira. A pesquisa inclui somente os sete últimos dias dos entrevistados, e ele não participa da enquete desde 4 de outubro. Clinton disparou uma vez que ele estava fora da amostragem pela primeira vez em várias semanas.

Como ele fez tanta diferença? E por que a pesquisa foi tão anômala? Isso aconteceu porque a pesquisa USC/LAT tomou algumas decisões atípicas ao elaborar e ponderar sua pesquisa.

Vale a pena observar que essa análise só é possível porque a pesquisa é extremamente e admiravelmente transparente. Ela publicou um conjunto de dados e a documentação necessária para replicar a enquete.

Nem todas as escolhas da pesquisa estavam destinadas a ajudar Trump. Mas algumas delas sim, e todas elas se combinaram a um azar terrível para produzir uma das anomalias mais persistentes nas eleições dos últimos tempos.

Grupos pequenos, grandes ponderações

Praticamente todas as pesquisas são ponderada s—ajustadas para se adequar às características demográficas da população, muitas vezes por idade, sexo e instrução, entre outras variáveis.

A pesquisa do USC/LAT não é nenhuma exceção, mas ela toma duas decisões atípicas que, combinadas, produzem um resultado singular.

Ela pondera para grupos minúsculos que resultam em grandes ponderações

Uma típica pesquisa nacional normalmente pondera para se certificar de que seja representativa em categorias bem amplas, como o número certo de homens ou o número certo de pessoas entre 18 e 29 anos.

Conheça algumas curiosidades sobre as eleições americanas

A pesquisa do USC/LAT pondera para muitas categorias minúsculas: como homens de 18 a 21 anos, que segundo estimativas do USC/LAT correspondem a cerca de 3,3% da população adulta. Ponderar simplesmente para pessoas de 18 a 21 anos seria bastante ousado para uma enquete política; para homens de 18 a 21 anos é realmente atípico.

Não há necessariamente nada de errado em ponderar para pequenas categorias como essa. Mas é arriscado: preencher todas essas pequenas categorias em geral requer mais ponderações.

Por exemplo, uma pesquisa USC/LAT pode ter somente 15 homens de 18 a 21 anos, aproximadamente. Mas para esses eleitores representarem 3,3% da amostra ponderada, esses 15 eleitores precisariam ter o mesmo peso que 86 pessoas —um peso médio de 5,7.

Quando você começa a considerar as demandas concorrentes em múltiplas categorias, pode ser que logo se torne necessário dar uma quantia surpreendente de peso extra para eleitores particularmente sub-representados, como homens negros de 18 a 21 anos.

Esse não seria um problema com categorias mais amplas, como pessoas entre 18 e 29 anos, e não existem muitas pesquisas nacionais que estejam ponderando entrevistados mais de oito ou dez vezes. As ponderações extremas para o eleitor negro de 19 anos de Trump em Illinois não são normais.

A pesquisa USC/LAT pondera a partir de eleições passadas.

A pesquisa USC/LAT faz outra coisa que é realmente atípica. Ela pondera a amostra de acordo com como as pessoas disseram ter votado na eleição de 2012.

Suas ponderações são tamanhas que os eleitores de Obama representam 27% da amostra, e os eleitores de Romney representam 25%, refletindo a divisão de 51% a 47% entre os eleitores de fato em 2012. O resto inclui aqueles que ficaram em casa ou que só agora estão aptos a votar.

Não sei de nenhuma pesquisa de opinião pública confiável que pondere votos passados declarados espontaneamente para os resultados relatados de fato de uma eleição.

Você pode ler mais sobre a questão do "voto passado" da USC/LAT em meu artigo de 8 de agosto no "The New York Times", mas o grande problema é que as pessoas não relatam seus votos passados de forma muito precisa. Elas tendem a exagerar o relato em três itens: o ato de terem votado, o voto no vencedor e o voto em algum outro candidato. Elas tendem a declarar menos o voto em um candidato derrotado.

O mesmo vale para a pesquisa USC/LAT. Se a pesquisa não incluísse uma ponderação de voto passado, o voto passado de seus entrevistados seria Obama 38, Romney 30. Isso se parece muito com as pesquisas nacionais que foram publicadas por volta da mesma época em que a pesquisa USC/LAT, assim como aquelas da NBC/WSJ ou do NYT/CBS News.

Ao enfatizar votos passados, elas podem subponderar de forma significativa aqueles que alegam ter votado em Obama e dar muito mais peso a pessoas que dizem não ter votado.

Dois fatores-chave

Esses dois fatores —uma amostra sobre-ponderada e o uso de votos passados— parecem explicar a preponderância da diferença entre a pesquisa USC/LAT e outras pesquisas.

Se a pesquisa fosse ponderada para um conjunto genérico de categorias de censos como a maior parte das pesquisas (quatro categorias de idade, cinco categorias de nível de instrução, gênero e quatro categorias de raça e origem hispânica), Hillary teria liderado em cada uma das repetições da pesquisa, com exceção do período imediatamente após a convenção republicana. A pesquisa USC/LAT pondera por todas essas categorias demográficas, mas ela só pondera para grupos menores.

Cerca de metade da diferença pode ser atribuída às pequenas categorias demográficas que levam o eleitor negro de 19 anos de Trump em Illinois a receber enormes ponderações. A outra metade da diferença é por causa da ponderação da votação passada.

Dos dois fatores, provavelmente era inevitável que usar o "voto passado" criaria um problema. As potenciais tendenciosidades de se ponderar o voto passado são muito bem conhecidas.

Mas os custos da extensa ponderação da pesquisa do USC/LAT não eram tão inevitáveis assim.

Jill Darling, a diretora de pesquisa do USC Center for Economic and Social Research, observou que eles haviam decidido não "aparar" as ponderações (isso acontece quando uma pesquisa evita que uma pessoa seja ponderada por mais de determinada quantia, como cinco ou dez) porque a amostra sub-representaria afro-americanos e eleitores jovens.

Isso faz sentido. O Gallup se encrencou por esse motivo em 2012, uma vez que aparou suas ponderações de eleitores não brancos ficaram sub-representados.

Em geral, a escolha por "aparar" ponderações fica entre tendenciosidades e variância nos resultados da pesquisa. Se você apara as ponderações, sua amostra será enviesada; ela pode não incluir um número suficiente de eleitores que tendem a ser sub-representados. Se você não apara as ponderações, alguns poucos entrevistados muito ponderados poderiam ter o poder de influenciar a pesquisa. A pesquisa poderia ter um pouco mais de ruído, e a margem de erro poderia ser mais alta (observem que a margem de erro na pesquisa USC/LAT para eleitores negros sobe toda vez que os eleitores jovens e negros muito ponderados entram na pesquisa).

Mas a pesquisa da USC/LAT é um painel, o que significa que ela volta a contatar os mesmos eleitores várias vezes, de forma que ela acabou com o pior de dois mundos.

Se a pesquisa USC/LAT fosse uma pesquisa normal, o rapaz de 19 anos de Illinois poderia ter aparecido somente uma vez na pesquisa. Na maior parte do tempo, os eleitores jovens e negros muito ponderados tenderiam a votar em Hillary, garantindo que a pesquisa tivesse o número apropriado de eleitores negros e um resultado relativamente representativo.

Mas a pesquisa USC/LAT teve muito azar: a única pessoa sobre-ponderada na pesquisa não era representativa de seu grupo demográfico. As pessoas que conduziam a pesquisa basicamente ficaram presas no extremo da variação adicionada.

A pesquisa USC/LAT está presa com os entrevistados que tem. Se ela teve uma amostra ligeiramente republicana demais desde o início —e aparentemente ela teve, independentemente da ponderação--, não havia muito que ela pudesse fazer a respeito.

Tradutor: UOL

Veja também

UOL Cursos Online

Todos os cursos