cabecera

Miscelánea.

Tuesday, July 28, 2009

Verdades y mentiras estadísticas (La Media)

Casi cada vez que abro un periódico, leo internet, escucho alguna conversación de bar, surge de un modo u otro alguna sentencia impepinable sobre algún estudio estadístico. Ya conocen los clásicos: "Las mujeres tienen igual número de dedos que los hombres", "los neozelandeses tienen en promedio un pene más que las neozelandesas", "los chinos son (aún) más bajitos que los coreanos", "la renta per cápita de Taquistán es el doble de la de Nachonia"...

Todas esas proposiciones, que pueden ser ciertas o no, suelen ser mal interpretadas, tergiversadas y usadas falazmente en cualquién conversación. Y al contrario: en ocasiones un dato impepinablemente objetivo puede ser exprimido en pro de una corrección política mal entendida.



Cuando se hace un estudio sobre una población (ya sean señores, gatos, pantanos, estrellas, cuentas de ahorro, dedos de los pies...) es posible obtener miles de datos. Tantos que llegan a ser inmanejables, cuando no inútiles. Así que se trabaja con promedios. Cuando estamos en el colegio nos enseñan el más sencillo de todos, la media, y la adoramos como al becerro de oro que es.

Lo que no nos suelen decir es que en ocasiones es un dato inútil, verdadero origen de muchas confusiones y absurdeces.

Pongo un ejemplo:

En unas Jornadas sobre Vampirismo en la escuela, el pequeño vampiro Fernando lleva a su clase a su padre y a su familia para que dé una charla y haga un par de performances. Así, en el aula habrá unos treinta chavales de doce años, un preocupado profesor de treinta y cuatro (también llamado Fernando) y media docena de apuestos vampiros de seiscientos años de edad, año arriba o abajo.



En ese momento llega un inspector de educación, que por supuesto no distingue una gótica de doce primaveras de una duquesa bávara de seiscientas, y decide hacer un estudio sobre la edad de los alumnos de primero de secundaria. Hace sus cuentas y... Veamos... 30 por 12, más 34, más 6 por 600 son... 3994 años. Y como son 37 personas, la media de edad es de 108 años.

El inspector entonces pone en su informe:

Edad media del alumnado de primero de secundaria: 108 años.
Consideración nº1: Aumento de la tribu gótica, en detrimento de los gafotas.
Consideración nº2: Preocupante aumento de la edad media de los alumnos, debido al bajo índice de promoción.
Sugerencias: Facilitar la promoción por exceso de edad. Compra de crucifijos.


Y ya la tenemos liada con IU.

Por supuesto el jefe del inspector (el Súper Inspector, digamos), al leer diagonalmente el informe se queda únicamente con un dato. Con el número. Ese misterioso 108 que le hace imaginar que secundaria está repleta de achacosos ancianos en pantalón corto, chándales, mallas y pelocepillo jugando al dominó.

Luego, en la prensa, leemos: "Secundaria se llena de jubilados", y debajo: "¡La edad media de los niños de doce años es de ciento ocho años!"

Y la gente piensa, por error, que la culpa es de las matemáticas, que son inocentes como inocentes son el juego de las damas y la fision nuclear. Del estudio del inspector a la noticia hay varios errores encadenados:

1) El estudio se realiza sobre una muestra poco numerosa y mal elegida.
2) En la muestra se han colado seis vampiros y un licenciado con gafas.
3) Cuando nadie del aula tiene una edad similar a la edad promedio significa que la media no es un dato relevante. O que se nos han colado vampiros y licenciados entre los datos.
4) El Súper Inspector lee en diagonal, tomando café.
5) Los periodistas leen en diagonal, tomando cervezas. Además, el titular es gracioso y les da palo enmendar la plana a un Alto Funcionario. Y más en verano.

Sé que no me creen, pero esto ocurre todos los días. ¡Sépanlo!

En este ejemplo, como ven, la edad media de los individuos del aula no representa nada. No tiene ningún valor. Incluso si la intención del inspector hubiese sido la de hacer un estudio sobre la edad de los entes que ocupan en un momento dado un aula cualquiera de primero de secundaria, esa media de 108 años no serviría para nada, ya que nadie se acerca a esa edad. ¡El ente promedio no existe!

Y es que, cuando vemos un valor medio, nuestro cerebro, un vago sin remedio, supone sin pensarlo dos veces que todos los sujetos son similares. Y nos grita algo como: "¡Si hay 37 individuos y la edad media es de 108 años es porque todos estarán entre 105 y 110 años, más o menos! ¡Lo normal, vaya!"

Pero claro, nadie tiene 108 años, ni 100, ni 110, ni 50 ni 500. La media es una estafa en este caso...

¿Y cómo sabemos cuándo no lo es? ¿Cuándo la media sirve de algo? ¿Hay alguna cosa más que debamos aprender a manejar? ¿Por qué me vuelvo loco haciendo estos posts?

Todo eso, mañana.

Labels: , ,

17 Comments:

At 28 July, 2009 19:35 , Anonymous Webber said...

Gran post,

por fin el mundo entero podra entender porque la distribucion gaussiana se llama "normal". Cogno, porque describe "lo normal"!

Si supiera menearlo lo haria ipso facto!

 
At 28 July, 2009 19:41 , Anonymous Laorca said...

Ah! has caído en tu propia trampa. Creyendo que la media de tus lectores no sabría qué es la media...
Anyway está muy bien, se nota que dominas lo de profe de mates.

 
At 28 July, 2009 20:53 , Blogger javi said...

El tago de rollo sobra, quelosepas (se podria menear facilmente.) Me estas recordando a las entradas de CuriosoPeroInutil.

Por cierto, yo tenia entendido que la Normal es la Gaussiana de media 0 y desviacion estandar 1. ¿O me equivoco señorpofesor?

 
At 28 July, 2009 22:41 , Blogger ca_in said...

En el monito te tapas los ojos...

a) Porque está pidiendo una niña de doce años cuando ha quedado claro que la media de edad en ese aula es de 108 años.

b) Porque no quedan niñas vírgenes en el aula.

c) Para no ver lo que hará con la niña.

d) Porque acaba de entrar el inspector de educación.

 
At 28 July, 2009 23:20 , Anonymous M&m said...

Fijo que la respuesta es b, Caín.

Efe, gracias por poner el link de PeT en la otra entrada. El fin de semana me deleitaré con las tiras, que entre semana me contento con respirar y soñar con las vacaciones.

En cuanto al post de hoy ya lo decíamos el otro día en el curro: triángulos con triángulos y medias lunas con medias lunas.

Ah, dime que un inspector de educación no tiene otra flauta que tocar y que éste estaba esperando a que el óptico le tallara las gafas de madera... Pero bueno, la entrada ha sido didáctica. Los titulares me recuerdan a los de ese maravilloso diario digital que es el 20minutos. Es casi tan divertido como leer un mortadelo, sólo que "casi" es verdad.

Respondiendo a las preguntas: Nunca lo sabremos. En mis tiempos la campana de Gauss se usaba para intentar meternos en un saco de aprobados a todos los mediocres (y menos) de clase. Debemos aprender a manejar demasiadas cosas, lo difícil es saber cuáles. Lo tuyo tiene que ser masoquismo.

 
At 29 July, 2009 00:48 , Blogger Be said...

El punto cinco es real como la vida misma, que lo he visto yo. Un montón de veces.

 
At 29 July, 2009 01:18 , Blogger Efe Morningstar said...

Webber, mañana sigo, que me siento mega didacta y mega mividacarecedesentido. O sea, el estado de ánimo óptimo para dar la brasa con las mates.

Laorca, en realidad yo sólo estoy contando esto para, disimuladamente, ir subiendo el nivel y explicar la ecuación de Schrodinger en septiembre.

Javi, ya vi el otro día que me enlazaste en CpI, gracias. Conocía la página pero de paso. Tampoco soy de meneos, aunque he entrado alguna vez. Me gustan el anonimato y la pobreza. Snifs.

Ah, no, "normal" y "gaussiana" significan los mismo. La "normal estándar" es la que está tabulada, con media cero y desviación estándar uno.

Caín, muy bien. Has ganado un gallifante. A mí sólo se me había ocurrido un motivo.

Jo, qué triste soy.

M&m, de nada, encontrar esa url era fácil. Y, mmm, creo que el segundo titular es mi frase preferida de todo el post. Me encanta. Ejhem.

Ahm, yo no uso ninguna gaussiana para comprobar si soy demasiado duro con mis alumnos... La premisa de que la media de las notas puede ser establecida a priori es una falacia. Ajustar las notas a esa media impostada es una aberración lógica.

(Más aún, no todas las distribuciones son gaussianas, ni parecidas siquiera, por mucho que sea cómodo pensar que sí.)

Be, ya imaginaba yo que las cosas se hacían de esa manera. Es tan lógico... Yo haría lo mismo.

Más aún, yo sería un inspector excelente. Habría redondeado 108 a 100, y 12 a 10, para que todo fuese más bonito.

"¡La media de edad de los nños de diez años es de cien años!"

¡¡Precioso!! ¡No me digas que no!

 
At 29 July, 2009 10:30 , Anonymous Nelson said...

Señor demiurgo: le recuerdo que Ishmael y el que ésto escribe están esperando que usted dé el primer paso para comenzar nuestra andadura por este océano de fluctuante meteorología.

 
At 29 July, 2009 13:38 , Blogger Barbijaputa said...

Eh EFE, gran post.

El de la gaussiana ha molao, por cierto.

Yo la media sólo la utilizaba para calcular la nota final del trimestre de cada asignatura. Nunca más la volví a usar.

Pero ahora tengo una pregunta; Si yo saco un 0 y un 10, aquí la media no es representativa, pero la profe me aprueba con un 5. ¿Por qué lo hace si la media aquí no es buena? ¿Es una pregunta sin sentido? ¿Estoy demostrando que no me he enterado de nada? porque yo creo haberme enterado eh...

 
At 29 July, 2009 13:53 , Blogger Kalitro said...

La varianza, esa amiga.

Yo siempre recuerdo con cariño esa noticia que decía que las motos eran peligrosas y que Tráfico estaba preocupado. ¿Por qué? Porque los usuarios de motos se habían doblado y la cantidad de accidentes de motos habían aumentado un 30%. Si uno echa un par de cuentas sencillísimas ve que, bueno, que las motos son relativamente seguras. Pero no, el dato era que había más muertes en motoristas.

 
At 29 July, 2009 14:28 , Blogger Efe Morningstar said...

Nelson, sí, errr, estoy en ello. En cuanto acabe de alicatar mi estado de ánimo abro un blog para los tres. Uhuh...

Lo podemos llamar, parafraseando el de "Quédate a dormir", algo así como:

"Invítenos a cenar"

Creo que eso describiría PERFECTAMENTE nuestro espíritu.

Barbi, gracias. A ver, si tú me sacas un 0 y un 10 yo te pongo un 4, por el esfuerzo, y te mando a septiembre. Si me sacas un 10 y un 0 entonces te pongo un 3, y también te vas a septiembre.

Vaya, creo que no he explicado qué es una media ponderada, ni tampoco qué es una media armónica, ni una media geométrica, ni... Qué cosas.

 
At 29 July, 2009 14:31 , Blogger Efe Morningstar said...

Kalitro, las noticias de la DGT son sistemáticamente alarmistas. Como ese ejemplo que das hay muchos más.

Lo hacen a propósito para meter miedo, por supuesto. La máxima de la DGT debería ser "el fin siempre justifica los medios", o algo semejante.

 
At 29 July, 2009 14:54 , Anonymous Webber said...

Barbi, Efe,

si alguien saca un 10 y un 0, y suponiendo que intenta hacerlo bien significa que los examanes estan mal planteados. Siguiendo el argumento de Efe, y suponiendo que ese alguien es uno y uno trino, es un individuo que existe, po lo tanto "la media en este caso si que existe", de donde lo que no existe son bien el 0 o bien el 10.

He dicho, mas o menos.

 
At 29 July, 2009 16:37 , Blogger javi said...

¿Y la Mediana? ¿Y la Moda??? ¿Es que nadie va a pensar en la Moda?¿?

 
At 29 July, 2009 16:50 , Anonymous Nelson said...

Señor demiurgo: "Invítenos a cenar"...Me gusta; ¿aunque no crees que es poco sutil?

 
At 29 July, 2009 17:38 , Blogger Cattz said...

Cualquiera os invita a cenar con lo quejicas que sois XD

 
At 29 July, 2009 18:02 , Blogger Efe Morningstar said...

Webber, en realidad mi sistema para poner las notas consiste en:

1) Cierro los ojos.
2) Poso las manos sobre mi cuaderno de clase. (¡Este año no lo he perdido, bien!)
3) Inspiro.
4) Pongo las notas según me van llegando las voces.

Javi, no, no vamos a hablar de esas cosas. La mediana y la moda tienen una utilidad muy reducida. No sé ni para qué se siguen explicando en el colegio. La verdad, con todo lo que recortan cada año no entiendo cómo siguen sobreviviendo a tanto expolio.

Nelson, ¿cuándo ha sido la sutileza nuestro dominio? ¿Acaso no lo es la risa? (El autoescarnio, que diría Be.)

Cattz, te equivocas. Nelson carece de paladar, se come lo que sea sin saborearlo. Es el equivalente evolutivo de una cabra.

No, perdón, ES una cabra.

 

Post a Comment

Subscribe to Post Comments [Atom]

Links to this post:

Create a Link

<< Home