(15/12/2014) Hace unos días propuse un enunciado en el que existía un error en la interpretación de unos datos estadísticos y que había que localizar. Hoy traigo la solución, en la que explico la "paradoja de Simpson".
LA CORRECTA
INTERPRETACIÓN DE LOS DATOS
ENUNCIADO
En
Economía utilizamos datos estadísticos para interpretar la realidad tanto desde
la microeconomía como con un enfoque macroeconómico. Vamos a ver un ejemplo.
Suponga,
por simplificar, que en la Economía de un país existen dos sectores económicos: la industria y los
servicios. También por simplificar, consideraremos que existen dos tipos de
personas: las morenas y las rubias. Además, para que no existan diferencias que
puedan justificar otro tipo de
interpretaciones, imaginaremos que hay la misma cantidad de unas que de otras; 100 personas de cada tipo.
La tabla
siguiente muestra la distribución de las personas entre los dos sectores
económicos, indicando qué porcentaje de personas están ocupadas del total de
demandantes de empleo de cada tipo de persona (morenas o rubias) en cada sector.
Morenas
|
Rubias
|
|
Industria
|
9 / 10
(90 %)
|
64 /
80 (80 %)
|
Servicios
|
63 /
90 (70 %)
|
12 /
20 (60 %)
|
Total
|
100
|
100
|
Así, en
la industria, el 90 % de las personas morenas está trabajando (9 de 10) y tan
solo el 10 % está en paro. Las personas rubias tienen una menor tasa de
ocupación en este sector (un 80 %), pues están trabajando 64 de las 80 que
demandan empleo en la industria.
Respecto
al sector servicios, observamos la misma tendencia; el 70 % de las personas
morenas están trabajando (63 de 90), mientras que las personas rubias tienen
una menor tasa de ocupación: un 60 % , pues trabajan 12 de las 20 que demandan
empleo en el sector servicios.
La
conclusión está clara: tanto en el sector industrial como en el sector
servicios las personas morenas tienen una mayor tasa de ocupación que las
rubias (un 10 % más en cada uno de los sectores); en esta sociedad hay una
clara discriminación hacia estas últimas.
Halle qué planteamiento es erróneo en todo lo expuesto anteriormente.
SOLUCIÓN
Todas
las interpretaciones de los datos que se realizan en el enunciado son
totalmente ciertas a excepción de la última, que es la que se extrae como
conclusión: “en esta sociedad hay una clara discriminación hacia estas últimas
(las personas rubias)”.
En
efecto, la tasa de ocupación de las personas morenas es superior a la de las
personas rubias tanto en el sector industrial (90 % frente al 80 %) como en el
sector servicios (70 % frente al 60 %).
Sin
embargo, no se puede por ello concluir que existe una discriminación hacia las personas
rubias. Así, si vemos la tasa de ocupación total de morenas y de rubias,
podemos extraer una lectura totalmente diferente (incluso contraria) a la
anterior.
De
hecho, entre las personas morenas hay 72 (la suma de 9 y 63) que están ocupadas
de un total de cien, es decir, un 72 %, mientras que las rubias ocupadas son 76
(64 más 12), lo que supone un 76 % dado que también había cien personas rubias.
Por consiguiente, en este ejemplo hipotético, la tasa de ocupación de las
rubias es superior a la de las morenas.
La
pregunta que deberíamos responder a continuación es la siguiente: ¿cómo es
posible que las personas rubias tengan una tasa de ocupación global superior a
la de las morenas si su tasa de ocupación es inferior en ambos sectores?
Esto
es así porque existen diferencias de ocupación entre los dos sectores; en el
sector industrial la tasa de ocupación es superior a la del sector servicios, y
las personas rubias demandan empleo mayoritariamente en el sector con una mayor
tasa de ocupación: el sector industrial. Sólo si ponderamos los porcentajes por
el número de personas de cada tipo que demandan empleo en uno u otro sector
veremos la realidad de lo que está ocurriendo.
Esta
paradoja, que nos muestra que la interpretación de los datos sector a sector no
necesariamente ha de arrojar los mismos resultados que si lo hacemos de manera
agregada, recibe el nombre de “paradoja de Simpson”.
Hemos
de estar alerta, por consiguiente, para no realizar interpretaciones erróneas
de los datos.