Manipulación, intervencionismo electoral y todo tipo de críticas que dudan de la ética de las empresas que realizan estudios de opinión pública, han inundado la prensa y las redes sociales después del fracaso de las encuestas para predecir el resultado de la última elección presidencial.

La última encuesta realizada por CADEM erró por casi 9 puntos, lo que supera con largueza el margen de error. A pesar de todas las especulaciones, la razón por la cual la mayor parte de las encuestas fallaron está en el diseño metodológico.

De los 1.442 casos que componen su muestra, 423 fueron entrevistas cara a cara en puntos de afluencia. Eso significa que se pararon en la calle y encuestaron a las personas que pasaban por allí.

Como consecuencia de esa acción, no podemos afirmar que la encuesta CADEM es cien por ciento probabilística al introducir un sesgo importante. Solo tuvieron la probabilidad de contestar aquellas personas que pasaron por el mismo lugar y hora que el encuestador. A ello hay que sumar que el hecho de que tuvieran el tiempo y las ganas de contestar.

Otro aspecto a considerar, es que de acuerdo a las propias declaraciones de CADEM, el resto de los casos (1.019) fueron muestreados a partir de bases de datos propias de la empresas con números de teléfonos fijos y de telefonía celular.

Al parecer ese es un detalle mínimo, pero que tiene profundas implicancias metodológicas. Al combinar bases de datos con teléfonos fijos y celulares, se mezclan las unidades de análisis. La base de datos con teléfonos fijos implica una unidad de análisis por conglomerado; mientras que la que tiene celulares, por individuos.

Un teléfono fijo corresponde a un hogar, por lo que puede contestar cualquiera de sus habitantes. Una vez que alguien contesta, hay preguntar si tiene más 18 años, el género y la edad, para completar las cuotas de la estratificación. Eso significa que cuando llamo, no sé si me va a contestar el papá, la mamá, la abuelita o uno de los hijos. Es por eso que el hogar debemos considerarlo como un muestreo por conglomerado.

No ocurre lo mismo cuando llamamos a un teléfono celular. Cada smartphone corresponde a una persona específica, por lo que de antemano podemos saber su edad, sexo, comuna donde vive y hasta su nombre. Aquí no debiera ser necesario preguntar la edad, sexo y comuna de residencia, a no ser de que la base de datos carezca de dicha información. De ser ese el caso, la falta información sería suficiente como para afirmar que el estudio es no probabilístico.

Y al ser un estudio no probabilístico no es posible  determinar un margen de error, por lo que los resultados pasan a ser  más una guía, que otra cosa. Por lo mismo, la falla predictiva de las encuestas hay que ir a buscarla a los libros de metodología.

Dr. Oscar Jaramillo C.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

AlphaOmega Captcha Classica  –  Enter Security Code