terça-feira, 21 de outubro de 2014

Paulo Hubert - Pesquisas improváveis

- Valor Econômico

Os resultados das eleições de 5 de outubro trouxeram algumas surpresas. No Rio Grande do Sul, por exemplo, Tarso Genro (PT), aparecia com larga vantagem nas pesquisas (35% contra 20% dos votos totais no último levantamento do Ibope). Após a apuração, caiu para o segundo lugar, com 28,7% do total de votos. Na Bahia, aconteceu o contrário: o candidato do mesmo partido, Rui Costa (PT), aparecia com 36% dos votos totais, e terminou com 45,5%, eleito em primeiro turno. Em São Paulo, mesmo acertando o resultado final (Geraldo Alckmin do PSDB reeleito no primeiro turno), a última pesquisa Datafolha apontava uma votação 3,5 pontos percentuais acima do que foi observado nas urnas. A pergunta que ocorre então é: como explicar essas diferenças? São erros aceitáveis, já que as pesquisas são amostrais? Devem ser atribuídas à metodologia utilizada pelos institutos? Ou será o contrário: é o próprio resultado das urnas que não representa perfeitamente a vontade dos eleitores, que seria mais bem capturada pelas pesquisas?

Consideremos em primeiro lugar o erro aleatório. As pesquisas, afinal, são feitas com base em amostras de no máximo 2 mil eleitores (no caso das pesquisas para o governo dos Estados). Seria razoável portanto que, por mero acaso, ocorressem diferenças dessa magnitude. Ou não?

Conhecendo os resultados finais na população toda, podemos calcular uma medida de probabilidade associada a cada pesquisa. Assumindo que uma amostra aleatória seja retirada da população final, utilizamos um modelo simples (distribuição hipergeométrica) para obter a probabilidade de que ocorram, ao acaso, diferenças iguais ou maiores do que as que vimos nas pesquisas. Esse cálculo produz resultados interessantes. Em São Paulo, por exemplo, a última pesquisa Ibope apresentou uma diferença cuja probabilidade de ocorrência é de cerca de 1,27% (sempre considerando a probabilidade de diferenças iguais ou superiores à encontrada). Isso significa que esperaríamos encontrar uma diferença desse tamanho (ou maior) em uma a cada 79 pesquisas, aproximadamente. No caso do Datafolha, também em São Paulo, o resultado é ainda mais extremo: probabilidade de 0,0045%, uma diferença que ocorreria, ao acaso, apenas uma vez a cada 22.154 pesquisas (ver tabela).

Podemos interpretar esses valores de diferentes maneiras. Primeiro: sabemos que os institutos de pesquisa brasileiros não utilizam a amostragem aleatória. Esse tipo de estudo tem um custo elevado, e leva um tempo maior para ser concluído. Mas a utilização de metodologias alternativas (como a amostragem por cotas, por exemplo), de custo mais baixo, só deveria ser aceitável se produzisse estimativas de qualidade próxima àquelas feitas de forma completamente aleatória. E não parece ser esse o caso, já que uma amostra aleatória raramente produziria diferenças tão grandes como essas.

Em favor dos institutos, porém, há uma segunda interpretação possível: a mudança de opinião dos eleitores. Entre a realização da pesquisa e a votação propriamente dita, pode haver uma migração de votos de um candidato a outro. Para analisar esse argumento, podemos repetir o exercício acima e calcular qual o tamanho dessa mudança para que as diferenças observadas atingissem uma probabilidade mínima (digamos 5% - uma ocorrência a cada 20 pesquisas em média). A resposta é diferente em cada Estado. Em Alagoas, por exemplo, seria necessário que o primeiro colocado, Renan Filho (PMDB), perdesse 1,7% dos votos totais entre a realização da última pesquisa Ibope (entre 28/09 e 3/10) e a votação. No Distrito Federal, Rodrigo Rollemberg (PSB) teria que ter amealhado 3,6% dos votos entre a pesquisa e o pleito. Já em Pernambuco, Paulo Câmara, também do PSB, precisaria ter conquistado 9,8% dos eleitores nos últimos dias da campanha, para que a diferença entre a pesquisa Ibope e o resultado das urnas pudesse ser explicada pela mudança de opinião.

Não podemos descartar como impossíveis essas migrações. As próprias pesquisas, porém, mostram que grandes variações num espaço de poucos dias não são comuns. De modo que restaria, então, a terceira possibilidade: é o resultado das urnas que é impreciso. Seja pela dificuldade que alguns eleitores podem encontrar ao interagir com as urnas eletrônicas, seja por falhas mais graves no processo. Esta linha de argumentação ganha força se verificarmos a diferença entre os eleitores que declaravam voto em branco ou nulo, nas pesquisas, e a proporção final desse tipo de voto. Em todos os Estados, os levantamentos Ibope e Datafolha mais próximos do dia do pleito subestimaram a proporção de nulos e em branco. No Ceará, as pesquisas dos dois institutos apontavam 6% de nulos e em branco, e no final foram 14,8% dos eleitores a votar assim. No Piauí a diferença foi ainda maior: 2% no último levantamento do Ibope, contra 12,2% nas urnas. Isso significaria, portanto, que uma grande parcela de eleitores declarava preferência por algum candidato, mas terminou por anular seu voto. Se dispensarmos aqui a hipótese de mudança de opinião, as explicações possíveis são duas: ou o eleitor mentia para os entrevistadores, vítima de algum tipo de incômodo em declarar voto nulo, ou de fato a anulação do voto foi um ato contrário a seu desejo.

Não é objetivo deste artigo apontar qual das hipóteses acima é verdadeira. Constatamos, porém, um fato: as pesquisas para os governos estaduais forneceram estimativas distantes demais do resultado final, do ponto de vista estatístico. Considerando que essas mesmas pesquisas tiveram (e têm) grande influência em diversos setores da sociedade - da variação do índice Ibovespa à cobertura midiática das campanhas, passando pelo processo decisório de muitos eleitores - e que, além disso, esses erros podem levar a questionamentos sobre a eficácia do processo eleitoral eletrônico e sobre a isonomia dos institutos, acreditamos ser necessária e urgente uma ampla discussão sobre esses levantamentos e sua metodologia. Só assim podemos aceitar as pesquisas como o que elas pretendem ser: instrumentos científicos de mensuração da preferência dos eleitores.


Paulo Hubert é mestre em estatística pelo IME-USP. Colaborou Samuel Moura, cientista político e pesquisador do Cebrap

Um comentário:

Anônimo disse...

O texto do Sr. Paulo Hubert é excelente e reforça a necessidade de investigarmos os níveis de confiabilidade das urnas eletrônicas. Se todas as análises estatísticas levassem em conta as considerações multidisciplinares sugeridas pelo autor, o mundo seria menos aleatório e, com isso, todos nós sairíamos ganhando. O fato é que as distorções comportamentais fazem da estatística uma ciência com credibilidade limitada, pois o sistema não é linear. Forte abraço, Dr. Mateus Fogaça