Entendendo os erros do Datafolha

Entendendo o erro do Datafolha em 5 de outubro

O resultado do primeiro turno das eleições presidenciais, em 5 de outubro, teve diversos vitoriosos e derrotados, dependendo do ponto-de-vista de quem analisa. Mas poucos discordarão de que os institutos de pesquisa, sobretudo os mais conhecidos e divulgados – IBOPE e Datafolha – estão entre os principais perdedores.

Durante mais de um mês, as pesquisas insistiram em que Marina Silva ocupava o segundo lugar, à frente – às vezes bem à frente – de Aécio Neves. Mesmo numa pesquisa realizada na véspera da eleição, Marina aparecia em situação de “empate técnico” com o candidato do PSDB, embora já então numericamente atrás. Abertas as urnas, verificou-se que Aécio Neves teve mais de 11% dos votos a mais do que Marina Silva: 30,31% a 19,26% dos votos totais.

É evidente que tal discrepância ultrapassa, em muito, a margem de erro declarada das pesquisas, e que também não pode ser explicada, como tentaram fazer porta-vozes dos dois grandes institutos, por uma suposta fluidez ou volatilidade do eleitorado. Não é crível que um dos candidatos tenha conquistado, do sábado para o domingo, na ausência de qualquer fato extraordinário, cinco milhões de votos.

O Datafolha publicou, no âmbito de sua pesquisa realizada em 14 e 15 de outubro, dados que permitem confirmar a intuição afirmada acima. Perguntou-se ao entrevistado quando sua decisão de voto havia sido tomada. E as respostas foram as seguintes:

Percentual de eleitores, por momento da decisão
Momento da decisão Dilma Aécio Marina
Um mês antes 76% 62% 66%
Uma quinzena antes 7% 15% 13%
Uma semana antes 6% 10% 7%
Na véspera 4% 6% 5%
No dia da eleição 7% 7% 8%

Ora (a não ser que o Datafolha esteja errando quanto a esses dados como errou nos percentuais dos diversos candidatos no primeiro turno), isso significa que 60% do eleitorado já havia decidido seu voto em 5 de setembro. O que não é compatível com a imagem de um eleitorado que muda de voto qual pluma ao vento, como tentaram nos convencer os representantes dos institutos de pesquisa.

Mas vamos adiante. Se os números da tabela acima (que são do próprio Datafolha, é bom lembrar), então o percentual dos votos de cada candidato que já estava definido em cada um dos momentos seria o seguinte:

Eleitores já decididos, por momento da decisão
Momento da decisão Dilma Aécio Marina
Um mês antes 76% 62% 66%
Uma quinzena antes 83% 77% 79%
Uma semana antes 89% 87% 86%
Na véspera 93% 93% 91%
No dia da eleição 100% 100% 100%

Ora, se calcularmos esses percentuais sobre os votos efetivamente obtidos pelos candidatos em 5 de outubro, veríamos que os percentuais do eleitorado que já tinha efetivamente se decidido a favor de cada um deles, em cada um dos momentos descritos na pesquisa seria o seguinte:

Percentual do eleitorado já decido a votar em cada candidato
Momento da decisão Dilma Aécio Marina Total
Um mês antes 28,56% 18,79% 12,71% 60,07%
Uma quinzena antes 31,19% 23,34% 15,22% 69,75%
Uma semana antes 33,45% 26,37% 16,57% 76,39%
Na véspera 34,95% 28,19% 17,53% 80,67%
No dia da eleição 37,58% 30,31% 19,26% 87,16%

Estes números seriam os percentuais mínimos de eleitores que estariam apoiando cada um dos candidatos em cada momento da campanha. Na realidade a intenção de voto de cada um deles poderia ser (e quase com certeza era) maior, na medida em que, por exemplo, um eleitor de Aécio Neves que tenha se decidido a votar no candidato na véspera da eleição poderia estar anteriormente apoiando, digamos, Marina Silva. Assim Marina poderia ter uma intenção de voto maior do que 13% em 5 de setembro, como Aécio poderia ter mais de 19%.

Mas Aécio não poderia ter menos do que 18% das intenções de voto em 5 de setembro. Entretanto, vemos abaixo que, segundo o Datafolha, Aécio tinha apenas 14% das intenções de voto em 3 de setembro. E que o Datafolha continuou a atribuir a Aécio consideravelmente menos intenções de voto do que as que deveria ter, se os eleitores não estão errando a respeito de quando decidiram seus votos.

Intenções de voto, segundo o Datafolha
Data Dilma Aécio Marina Outro 1
03/09/2014 35% 14% 34% 17%
18/09/2014 37% 17% 30% 16%
30/09/2014 40% 20% 25% 15%
04/10/2014 44% 26% 24% 6%
05/10/20142 37,58% 30,31% 19,26% 12,85%
1 Inclui, além dos outros candidatos propriamente ditos, indecisos, brancos e nulos.
2 Resultado das eleições

Desta forma, quando os eleitores entrevistados declaram ao Datafolha quando foi que tomaram as suas decisões de voto, eles desmentem as pesquisas divulgadas pelo instituto durante a campanha eleitoral. Uma das duas pesquisas tem necessariamente de estar errada. E como o contraste entre as pesquisas realizadas antes do primeiro turno e os resultados em urna no dia 5 de outubro é gritante, tudo indica que o erro, no mínimo, é maior nas pesquisas anteriores.

É curioso, entretanto, que não apenas o Datafolha tenha errado por uma margem tão grande, como também o IBOPE. Não há como afirmar, naturalmente, que os erros tenham sido intencionais, mas a coincidência é intrigante, embora possa resultar também de equívocos partilhados por ambos os institutos no que toca à efetiva segmentação do eleitorado brasileiro por “classe” de renda, escolaridade, ou religião. E é sem dúvida lamentável que ainda não tenhamos tido acesso a nenhuma reavaliação dos métodos e pressupostos utilizados no período recente por parte dos institutos.

Entretanto, qualquer que seja o motivo do erro, ele criou a seguinte imagem da campanha eleitoral:

datafolha%2C%20dados%20das%20pesquisas%20publicadas.png

Em que transparece a ideia de uma candidatura que cresce de forma estável e lenta (Dilma), outra que cai de forma acelerada (Marina) e uma terceira que cresce de forma cada vez mais rápida (Aécio), não sendo difícil extrapolar uma ultrapassagem de Aécio sobre Dilma logo após as eleições.

Em contraste, se imaginarmos a campanha eleitoral sob outra perspectiva – a sugerida pela pesquisa de 14 e 15 de outubro, ao investigar em que momento os eleitores se decidiram a votar como fizeram – teremos uma figura radicalmente diversa:

datafolha%2C%20evolu%C3%A7%C3%A3o%20segundo%20a%20data%20de%20defini%C3%A7%C3%A3o%20de%20voto.png

Em que todas as candidaturas crescem (como é natural, em detrimento dos indecisos), mas com a candidatura de Dilma (que começa subindo mais lentamente) crescendo de forma mais claramente acelerada – um desenho que não deixa supor nenhuma tendência “natural” a uma ultrapassagem como simples continuidade do movimento anterior das intenções de voto.

Assim, os erros do Datafolha e do IBOPE, ainda que não tenham sido intencionais, contribuíram para criar uma expectativa de um determinado resultado eleitoral, que não parece ter qualquer base na realidade. Se essa expectativa tem, ou pode ter, algum tipo de impacto sobre o comportamento real do eleitorado – em que medida, por exemplo, pode se constituir uma profecia que se auto-realiza, ou, ao contrário, se auto-destrói – é outra questão. Mas foi divulgada ao eleitor brasileiro, como se fosse verdadeira, uma imagem completamente distorcida da realidade.

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License