Evaluación de las encuestas de la elección presidencial

En plena disputa poselectoral, los resultados de las encuestas se esgrimen como argumento de un fraude y se utilizan para impugnar la elección presidencial. En los medios se cuestiona la confiabilidad de los estudios de opinión, y hay terceros que aseveran que nunca se habían cometido tantos errores en la aplicación y análisis de estos ejercicios. ¿Qué tan ciertos resultan estos cargos a la luz de los hechos, la teoría estadística y las experiencias de otras naciones?

Consideraciones generales

Frente a los resultados de las encuestas de la elección presidencial de 2012, presenciamos una situación paradójica: nunca se habían realizado tantas encuestas y tan bien hechas —como se demuestra más adelante— y nunca se habían cuestionado tanto sus resultados ni se había acusado tanto a las casas encuestadoras de participar en una maniobra política para engañar a la opinión pública y promover a un candidato. La situación surge del hecho de que las mediciones son correctas pero su lectura es equivocada. Ahí están los hechos cuantificados por las encuestas, pero nuestra joven democracia no tiene la experiencia para procesarlos y, dado que no están bien analizados, son manipulados.

Primero, hay que describir dos características intrínsecas de las encuestas: los rechazos y la no respuesta. La negativa a participar en los sondeos se ha incrementado en gran medida con el ambiente de inseguridad que vive el país, que fomenta la desconfianza. Por otro lado, afecta el desgaste de la élite gobernante que, desde 1982, no acierta más que a mantener la estabilidad financiera y arroja índices de crecimiento precarios. La opinión pública atribuye el estado de las cosas a los factores de poder reales, a la ineficiencia y corrupción de los políticos, y a que estos anteponen sus intereses personales a los del país, impiden consensos y bloquean el desarrollo. Esta desesperanza se manifiesta en la elección federal de 2009 con el “voto nulo o blanco”: un número relevante de ciudadanos acude a votar pero cancelan su voto como protesta. Pocas casas encuestadoras informan sobre los rechazos, pero estos fluctúan conservadoramente entre 25 y 35%. Por otro lado, el promedio de la no respuesta es de 16.3%; su desviación estándar (de), de 3.2; su máximo, de 23%; su mínimo, de 6%; y el rango o diferencia entre el máximo y el mínimo, de 17 puntos porcentuales (pp). En el uso cotidiano se desvirtúa el significado de este segmento de los empadronados llamándolo de los “indecisos”, pero este es un saco donde caen otras categorías: la no respuesta y los indecisos propiamente dichos, así como el voto oculto y el voto vergonzante, el voto nulo o ninguno, entre otros. La combinación de estos dos factores implica que las encuestas no toman en cuenta alrededor de 40% de la población objetivo. Se ha dejado de lado a los que no responden las encuestas o a la pregunta de intención de voto, asumiendo que se comportan en promedio como la población que sí responde. Las estimaciones originales se denominan resultados brutos, y las que realizan la estimación repartiendo la no respuesta en forma proporcional se conocen como resultados efectivos. Este es el modo de calcular los resultados efectivos, sin importar el nivel de rechazo o de no respuesta que se tenga. Se basa en el principio definido por Pascal de la “distribución uniforme de la ignorancia”. ¿Qué validez tienen las estimaciones sobre la población total realizadas a partir de un subconjunto de esta? Se han realizado experimentos y se ha validado que esta práctica no sesga los resultados o al menos no de forma que la imagen resultante sea distorsionada.

Segundo, para esta elección los errores de las estimaciones de intención de voto para Enrique Peña Nieto (EPN) y Andrés Manuel López Obrador (AMLO) están correlacionados, es decir que no son independientes sino que se asocian: mientras más sobrestimados los resultados de EPN, más subestimados los de amlo. Ningún encuestador subestimó a epn y solo tres sobrestimaron a amlo, y por magnitudes pequeñas (Ipsos-Bimsa, 1.7 pp; Berumen, 1.5 pp, y Buendía y Laredo, 0.1 pp) (Gráfica 1).

Este resultado es el aspecto que desconcierta a la opinión pública e incluso a algunos analistas: el hecho de que las diferencias entre los candidatos muestren diferencias que parecen no justificables. La explicación más adecuada de dicha asociación —que implica, a nivel de los ciudadanos, una declaración a los encuestadores de intención de voto a favor del PRI-PVEM y una decisión y un voto en las urnas a favor de la alianza de izquierda— es un cambio masivo en la preferencia de un partido por otro en el último momento de la elección. Este hecho no es una rareza ni el resultado de una confabulación de todos los encuestadores para hacer aparecer a un candidato como el virtual ganador, sino consecuencia de la intención y el propósito de las campañas y de la conducta de los votantes. Cuando el cambio es verdaderamente masivo, provoca variaciones sorprendentes en los resultados electorales esperados. Este fenómeno político-social se conoce en la literatura como landslide, lo que se puede traducir como ‘avalancha, reversión o vuelco’. No es frecuente pero es familiar en los países de larga tradición democrática, como Estados Unidos y el Reino Unido. Wikipedia enumera en el Reino Unido seis casos después de la Segunda Guerra Mundial; en tres ocasiones el Partido Laborista logra contundentes victorias sobre el Conservador (1945, 1997, 2001) y en otras tres sucede lo contrario, el partido Conservador derrota al Laborista (1959, 1983, 1987). Destacan las elecciones de 1945, cuando el héroe de la Segunda Guerra Mundial, Winston Churchill, le gana al laborista Clement Attlee; y las de 1983, en las que la conservadora Margaret Thatcher derrota a Michael Foot. En esta lista no figura la victoria de los laboristas en la elección de 2001, que los medios llamaron la “reversión tranquila”, ya que no cambió el partido en el poder y los resultados no fueron muy distintos de la elección previa; parecía que se daría la alternancia pero no se produjo.

La elección presidencial de México de 2012 se puede clasificar como una “reversión incompleta”, ya que le faltó mayor fuerza y contundencia y, sobre todo, tiempo. La magnitud y el alcance de este fenómeno en México fue cuantificado por las encuestas, cuyo servicio a la sociedad no solo consistió en el seguimiento y monitoreo de las mudanzas y vaivenes de la elección. Más allá del predominio a lo largo de todo el periodo de campañas —aunque en declive— del puntero EPN, en una primera etapa vemos el sorprendente avance de Josefina Vázquez Mota (JVM) y su triunfo sobre el delfín del pan, y el prolongado estancamiento de amlo con la campaña de la “República amorosa”. En una segunda etapa, la campaña de JVM tropieza y comienza una disputa entre ella y amlo por el segundo sitio, en la que ambos temen ser víctimas del voto útil que finalmente no se produce. La tercer etapa consiste en el despegue de amlo y su lucha para desbancar al líder, apoyado por el movimiento #YoSoy132 de las juventudes armadas con las herramientas de las redes sociales, a quienes anima el hartazgo frente al status quo y la falta de oportunidades. Este fue a grandes rasgos el drama y el espectáculo de una elección que para algunos parecía tranquila y aburrida.

Este fenómeno fue percibido por diversos analistas perspicaces: José Antonio Crespo, Jorge Chabat, Jesús Cantú, Jaime Sánchez Susarrey, Federico Reyes Heroles, Sergio Sarmiento, Francisco Báez Rodríguez, René Delgado y Miguel Basáñez, entre otros, manifestaron que la elección sería entre dos y que sería más cerrada de lo que señalaban las encuestas. Esto se puede explicar por otros factores. Sergio Sarmiento (Reforma, 13 de julio de 2012) destaca el “efecto borrego”. Las encuestas de salida (Grupo Reforma, Parametría, Consulta Mitofsky) detectaron un porcentaje importante de ciudadanos que pospusieron hasta el último momento su decisión, validando el comportamiento de elecciones previas. Francisco Abundis lo atribuye a “un fenómeno medible, llamémosle clima electoral, percepción de ganador o espiral del silencio”. También le da importancia a los cambios de la última semana, que las encuestas midieron pero no difundieron por la veda electoral (Carta Parametría, 4 de julio de 2012). Esta es precisamente una de las características de los vuelcos o reversiones que no se manifiestan en su verdadera magnitud hasta que se cuentan los votos. En última instancia, también hay que considerar que las ciencias sociales tienen límites ya que las metodologías, tan exitosas en las ciencias naturales, al aplicarlas al estudio de las opiniones, conductas y acciones de los seres humanos, se enfrentan a la incertidumbre del libre albedrío y a la voluntad de hombres y mujeres.

Para un candidato-líder, como para un jugador, es muy difícil detenerse cuando faltó tiempo para ganar. Desea tiempos extra y alargar los segundos, más cuando existe una fuerte voluntad de poder. Por ello, amlo no reconoce la derrota ni puede concluir su campaña. Igual que en ocasiones previas, continuará su lucha fuera de los tiempos, instituciones y límites legales. En esta desesperada batalla todo se vuelve un arma. Por ello las encuestas, cuyo objeto principal es registrar y medir los cambios en la intención de voto y sus determinantes, son parte de su arsenal. Si producen resultados similares es porque su naturaleza es reproducir la opinión pública, y porque para ello aplican metodologías similares. Esta es la esencia de la ciencia: la replicación independiente de los experimentos y mediciones. Este hecho se ha explicado por los propagandistas de amlo como un resultado de la corrupción y la compra de todas las casas encuestadoras, en una gran confabulación orquestada por EPN. Hace más de 12 años, cuando amlo iniciaba su campaña por la jefatura del Gobierno del Distrito Federal, declaró que una encuesta de El Universal-Alduncin —que lo ubicaba en un lejano tercer lugar— “estaba pagada por Los Pinos”. Le pedí una cita que después de un tiempo concedió. Le exigí presentar sus pruebas o una disculpa pública. Le recordé que pocos meses antes El Universal publicó una encuesta donde lo ubicaba como el precandidato de la alianza de izquierda con mayores probabilidades de lograr la candidatura. Le pregunté si medió algún pago por esa encuesta y le expliqué que las encuestas solo registran la opinión de los ciudadanos. Concedió todos los puntos y me mostró encuestas similares a las de El Universal, pidió comprensión y simpatía por su causa y se disculpó. Le pedí que su disculpa fuera pública, a lo que se negó: “Ningún político lo haría porque entonces no sería político”. Para López Obrador, un político que reconoce sus errores y no miente no es un político. Desde entonces descalifica las encuestas que no lo favorecen, dice que “son copeteadas y a modo”, a la vez que anuncia encuestas donde él lleva la ventaja y es el ganador, encuestas por lo demás que nunca aparecen, sencillamente porque no existen. Según sus declaraciones, todos los encuestadores participan en la corrupción y son parte de la mafia en el poder. Ahora también está involucrada la casa encuestadora de su preferencia, Covarrubias y Asociados, que en 2006 equivocó los resultados de un conteo rápido y de sus encuestas preelectorales, pero que en esta elección tuvo el valor y el mérito de publicar su última encuesta, la más acertada, que no favorecía a AMLO y en cambio le daba una amplia ventaja a EPN. Para amlo todo es válido ya que “México necesita una revolución pacífica y democrática” que él encabeza bajo su peculiar ideología.

En resumen, el espíritu de linchamiento y denostación de las encuestas que cunde en los medios masivos y la acusación de que fallaron no tiene fundamento; la crítica no se basa en errores metodológicos o de campo y su propósito es político. En la elección presidencial, por no hablar de las del Congreso y las estatales concurrentes —incluyendo la renovación de todos los poderes del Distrito Federal—, las encuestas prestaron un invaluable servicio a la sociedad y a los políticos. Describieron con inusual precisión y nitidez la evolución de las campañas y de la intención del voto. Los errores cometidos fueron menores a los esperados, las metodologías y prácticas se han depurado y sofisticado. Existe el deseo de continuar el aprendizaje y alcanzar nuevas cotas de excelencia. Si bien algunos de los encuestadores alcanzaron niveles de protagonismo y publicidad, no exentos de tintes partidistas y propagandísticos, el profesionalismo y la seriedad caracterizaron a las casas encuestadoras.

Evaluación de las encuestas con base en el análisis de sus errores

Fueron 46 las que se publicaron el mes de junio (Cuadro 1). Todas aciertan en lo que se refiere al ganador, todas dan cuenta exacta de la posición de cada contendiente. De acuerdo con el criterio estadístico para evaluarlas —esto es, el error promedio de la diferencia entre el resultado final del conteo distrital de los votos que realiza el IFE para cada candidato y la estimación de cada encuestadora en términos absolutos (sin contar el signo positivo o negativo de esta diferencia)—, todas las encuestas se ubican en cotas aceptables. Solo tres encuestas (6.5%) superan un error promedio de 3 pp, pero este es menor a 4.15 pp —no del todo mal. En el otro extremo, el de la mayor certidumbre, destacan siete encuestas excelentes (15.2%) con errores promedio menores a 2 pp: Covarrubias (error promedio de 1.31 pp), Demotecnia (1.55), Parametría (1.67), Ipsos-Bimsa (1.85), Berumen (1.91), Reforma (1.98) y Consulta Mitofsky (1.98). Estas fueron las mejores encuestas. Del resto de las encuestas, 18 (39%) satisfacen la expectativa de un error de +/-3% con un nivel de confianza de 95%. Otras 18 encuestas (también 39%) presentan un error promedio de entre 3 y 4 pp. Por número, corresponden a GEA-ISA 25, más de la mitad (54.3%); a Consulta Mitofsky, 5 (10.9%); a Parametría, 4 (8.7%); a Buendía y Laredo, 3 (6.5%); a Con Estadística, 3 (6.5%); a Reforma, 2 (4.3%). Con solo una están Covarrubias, Demotecnia, Ipsos-Bimsa y Berumen. La distribución de los errores debería seguir una curva normal (Campana de Gauss), sin embargo se inclina hacia el lado favorable.

El promedio de estas encuestas —lo que hemos llamado la encuesta de encuestas— muestra para cada uno de los candidatos las siguientes estimaciones, errores, de, máximo, mínimo y rango: EPN, 44.3%; error de 5.1 pp; de, 1.7 pp; máximo, 47; mínimo, 40.1, y rango, 6.9 pp. Todas las encuestas presentan una sobrestimación y la desviación estándar de solo 1.7 señala un alto consenso entre las estimaciones.

AMLO, 28.4%; error, -4 pp; de, 1.9 pp; máximo, 34.1; mínimo, 25.1, y rango, 9 pp. No todas las encuestan presentan subestimación, pero la desviación estándar y el rango hablan de mayor dispersión en las estimaciones.

JVM, 24.4%; error, -1.7 pp; de, 1.2 pp; máximo, 26.6; mínimo, 21.7, y rango, 4.9 pp. Se observa una subestimación. Las medidas de dispersión apuntan a un mayor consenso entre las encuestadoras.

Gabriel Quadri de la Torre (GQDT), 3%; error, 0.6 pp; de, 0.8 pp; máximo, 4.6; mínimo, 1.2, y rango, 3.4 pp.
La muestra promedio de las encuestas es de mil 229 entrevistas, con una de de 392. La muestra máxima es de 3 mil 480 (Berumen) y la mínima de mil (Parametría, Ipsos-Bimsa, Consulta Mitofsky) (Gráfica 2).

En el promedio de todas las encuestas, la diferencia entre el primer y segundo lugares (EPN y AMLO) es de 15.9 pp. Considerando que la diferencia entre ambos candidatos en el conteo oficial del IFE fue de 6.8 pp, hay un error de 9.1 pp, una de de 3.3 pp, un máximo de 20.7, un mínimo de 7.1 y rango de 13.6 pp. Tal como sucedió con la estimación de la intención de voto para EPN, todas las encuestas presentan una sobrestimación de la diferencia entre el primer y segundo lugares. Ello se debe a que en este caso la de opera multiplicada por un factor de dos: en la lucha entre dos candidatos, cuando uno pierde un punto el otro lo gana, y viceversa, lo que supone que la distancia se amplia o se acorta en dos puntos. Para que la ventaja promedio se redujera en 9 puntos, bastó que el cambio neto de la intención de voto entre los dos candidatos fuera de 4.5 pp. La tendencia registrada de EPN era a la baja y la de AMLO al alza, y esta se acelera en los días de veda de encuestas. Si aplicamos el criterio de las encuestas a estas distribuciones derivadas, el margen de error sería de +/-6% y la cota inferior del intervalo de la estimación sería de 9.9 pp. Esta se rebasa en promedio en 3.1 pp. Nada mal dado que las últimas estimaciones se realizaron una semana antes de la elección y precisamente cuando se acelera el fenómeno descrito de la reversión de la votación.

Esta estimación se complica cuando están implicados otros candidatos. En el caso de la diferencia entre JVM y AMLO, el promedio es de -4 pp; el error, de 2.3 pp (Conteo IFE, 6.3 pp); la DE, 2.7 pp; el máximo, 0.9; el mínimo, -11.6, y el rango, 12.5 pp. A pesar de que el promedio de esta distancia es casi cuatro veces menor a la estimada entre EPN y AMLO, su rango es casi el mismo (solo 7.4% menor), igual que la desviación estándar (solo 18% menor), lo que indica una alta variabilidad de los resultados entre las encuestas (gráficas 3 y 4).

______________________________________

ENRIQUE ALDUNCIN es director general de Alduncin y Asociados.

Acerca de este sitio	Contacto	Temas	Tipo de artículos	Publicidad
¿Quiénes Somos? Publicidad	Suscripciones Contacto	Ensayo Educación Economía Salud Data Migración Medio ambiente Ciencia Elecciones Encuesta Poemas/Poesia Crónicas del asombro Erotismos El espejo de las ideas Oyendo que es gerundio Mirador Becarios de la FLM Galaxia Gutenberg Obra gráfica Lecturas	Este País Cultura Indicadores Blog	¿Por qué anunciarse en Este País?

Dejar un comentario