Search

Este es un articulo promedio

Autor
Categoría
Home
Matem√°ticas
Medios
Fecha de Publicación
2018/10/22
7 more properties
Nicanor Parra fue un visionario y un rupturista en muchos aspectos. Invent√≥ un tipo de poes√≠a ‚ÄĒla antipoes√≠a‚ÄĒ, rompi√≥ los c√°nones de lo l√≠rico y hasta fue capaz de morir mirando hacia el mar estando en Santiago. Lo que no logr√≥ hacer fue popularizar el concepto de desviaci√≥n est√°ndar.
Espera, espera. KH√Č. ¬ŅC√≥mo pasamos de la antipoes√≠a a la desviaci√≥n est√°ndar? ¬ŅQuisawe√°?
¬ŅRecuerda usted esa frase popularizada por internet y atribuida a Nicanor Parra? Si t√ļ lo deseas puedes volar ¬ęHay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por persona¬Ľ. Esta frase es matem√°ticamente cierta, pero tambi√©n matem√°ticamente incompleta. ¬ŅPor qu√©? Porque se usa un solo n√ļmero ‚ÄĒel ¬ępromedio¬Ľ de consumo de panes‚ÄĒ para resumir la situaci√≥n de la totalidad de las personas. Como todo resumen, puede ser bastante fiel a la realidad o bien puede estar incompleto y esconder sutilezas. ¬ŅC√≥mo saber entonces cu√°ndo un promedio nos est√° dando informaci√≥n fiel o no?
Para tener un panorama completo, lo mejor sería presentar otros datos que resuman aspectos más profundos de la situación: esto nos permitiría tener una mirada más global y certera de lo que están informando.
¬ŅY de d√≥nde sacamos estos n√ļmeros?
Entrando al bello (?) mundo de las medidas de tendencia central y las medidas de dispersión.

Promedio

Si usted fue al colegio (algo que no nos queda del todo claro para mucha gente), seguramente sabe lo que es un promedio. Si estuvo coqueteando con repetir ‚ÄĒo de plano se ech√≥ un a√Īo‚ÄĒ sabe que para calcular un promedio cada valor es importante y pesa lo mismo.
Un promedio, o formalmente llamada media (medius promedius), es una suma de elementos dividida por la cantidad de elementos sumados. El promedio, en general, ¬†va a ser un n√ļmero que est√° por sobre algunos de los datos considerados y bajo otros. Siguiendo el mismo ejemplo del colegio, si usted sac√≥ promedio 6,0 en Historia y Geograf√≠a (acaso viejazo), lo m√°s probable es que usted haya tenido notas sobre 6,0 y notas bajo 6,0, y no necesariamente solo notas 6,0. O, tomando la cita referenciada al principio, no todos nos vamos a comer la misma cantidad exacta de panes, pues, se√Īor Parra.
Como mencionamos al inicio, el promedio es una de las formas de resumir una cantidad (posiblemente enorme) de datos en un solo valor. A este tipo de ¬ęres√ļmenes¬Ľ se les llama medidas de tendencia central y la idea es que el valor est√© ¬ęal centro¬Ľ de todos los datos. ¬ŅSimple, no?
Pues no tanto. Como decíamos al principio, hay que tener cuidado con la información que de verdad nos entrega el promedio.

Peque√Īo manual de c√≥mo NO interpretar promedios

Veamos, con unos ejemplos, cómo la interpretación de un promedio (algo simple en apariencia) puede llevar a situaciones muy exóticas.
El a√Īo 2014, La Tercera public√≥ un titular en su portada, sobre una medida de consumo de marihuana a nivel nacional. Mencionaba que ocho regiones presentaban un consumo ¬ęsuperior al promedio nacional¬Ľ. Dado que en 2014 el n√ļmero de regiones chilenas era 15, el titular est√° diciendo que el consumo de, m√°s o menos, la mitad de las regiones est√° por sobre el promedio nacional.
No hay que ser muy vivaracho para darse cuenta de que esto no es muy noticioso: solo est√° diciendo que aproximadamente la mitad de una serie de 15 datos (uno por regi√≥n) supera el promedio. Volviendo al ejemplo de su promedio en Historia y Geograf√≠a, es como si dijera que ocho de las 15 notas que tuvo durante el a√Īo eran superiores a 6,0 y las otras siete eran iguales o inferior a 6,0. Pues, claro: as√≠ funcionan los promedios, duh.
Pero mira esa we√°, hermano.
Otro ejemplo ocurre con frecuencia en la prensa chilena a la hora de analizar los resultados de la PSU. A fines de cada a√Īo, no es extra√Īo ver un titular alarmista del tipo ¬ęla mitad de los estudiantes sac√≥ menos de 500 puntos¬Ľ. La verdad es que el sistema de puntajes de la PSU est√° dise√Īado para que el promedio de los puntajes se sit√ļe siempre alrededor de 500 puntos y que la distribuci√≥n de puntajes sea ¬ęsim√©trica¬Ľ en torno a ese valor (en √Īo√Īo m√°s precisamente, se aproximan los datos a una distribuci√≥n normal con media 500). No es tan extra√Īo, entonces, que la mitad de los puntajes est√© bajo el promedio. O sea, de noticioso, no hay mucho.
De cada diez titulares de prensa que hablan de estadística, cinco son la mitad
Pero, aparte de estos casos, hay errores un poco más sutiles que pueden ocurrir a la hora de interpretar promedios. Usemos un ejemplo de juguete, llevando el caso del poema inicial al extremo. Supongamos que queremos medir el consumo de pan semanal por persona. Les preguntamos a 10 personas: nueve no consumen pan en lo absoluto y una sola persona consume 100 panes a la semana. El total de panes consumidos entre estas 10 personas es 100, por lo que el consumo semanal promedio es de 10 panes por persona. Fíjese que, a diferencia de los casos anteriores, acá es falso que la cantidad de personas bajo el promedio es cercana a la mitad. De hecho, casi todas las personas (el 90%) consumen una cantidad de pan que está bajo el promedio.
Si bien este ejemplo está cocinado porque estamos incluyendo a una sola persona que empuja todo el promedio hacia arriba, no es tan caprichoso plantearse casos así. En 2017, el Instituto Nacional de Estadísticas publicó que, dentro de la población ocupada, el sueldo promedio es de $\$554.493$. Sin embargo, al mismo tiempo, publicó que la mitad de las personas tenían un sueldo inferior a $\$379.673$. Muchísima diferencia.
¬ŅQu√© falla ac√°? ¬ŅPor qu√© el promedio no est√° representando fielmente los datos? ¬ŅC√≥mo se puede arreglar?

Medianas y desviaciones est√°ndar

Si bien mencionamos que el promedio es una medida de tendencia central, resulta que no es la √ļnica medida de tendencia central. Existen otras formas de resumir un conjunto de datos que en algunos casos pueden entregar informaci√≥n m√°s ¬ęcertera¬Ľ que el promedio.
Veamos un ejemplo: la mediana se define como el valor que est√° ¬ęen la mitad¬Ľ de un conjunto de datos. Por ejemplo, en el caso de los sueldos en Chile, si bien el promedio es $\$554.493$, la mediana de los sueldos es $\$379.673$. Esto significa que la mitad de las personas que trabajan ganan a lo m√°s $\$379.673$ y la otra mitad gana al menos $\$379.673$. En datos que var√≠an demasiado, la mediana puede dar una aproximaci√≥n m√°s realista del panorama global.
En un país como Chile, donde la desigualdad económica y social es altísima (1), utilizar promedios puede interpretarse como una distorsión antojadiza de la realidad. Al respecto se ha escrito ampliamente (2), sobre todo cuando se consideran los promedios de datos de la encuesta Casen considerando la inmigración (3). Utilizar promedios para dar a conocer una realidad nacional no ayuda a comprender la situación, más bien genera confusión y puede distorsionar la toma de decisiones.
Pero esto no significa que el promedio sea in√ļtil. El promedio, como manera de resumir un conjunto de datos, funciona bien cuando los datos est√°n todos muy ¬ęconcentrados¬Ľ en torno a un valor central. Esto es cierto en el caso de estudiar el consumo de marihuana en 15 regiones, o en el caso de la PSU, donde los puntajes por dise√Īo est√°n distribuidos de manera muy regular. En el ejemplo de los panes o el de los sueldos en Chile, los datos no est√°n bien distribuidos: existe un n√ļmero peque√Īo de datos que son much√≠simo m√°s altos que casi todos los otros. Entonces, estos datos extremos empujan el promedio hacia arriba y hacen que el promedio, por s√≠ solo, no represente fielmente la realidad.
Claramente este es un buen ejemplo de lo anterior, porque muchos ac√° aportamos con valores negativos :(
Por suerte, existe una forma de medir cuán bueno es un promedio (malditos estadísticos que pensaron en todo): son las llamadas medidas de dispersión y posiblemente la más popular es la desviación estándar.
La idea detr√°s de las medidas de dispersi√≥n es bastante intuitiva y podr√≠amos entenderla simplemente como ¬ęqu√© tanto se dispersan o separan mis valores respecto a una medida de tendencia central¬Ľ (por ejemplo, la media). Con panes se ver√≠a algo as√≠. La l√≠nea punteada del centro es el promedio, y toda el √°rea azul es la desviaci√≥n est√°ndar, es decir, cuanto se dispersan los panes respecto al delicioso pan promedio. En el primer ejemplo, el pan m√°s grande es una marraqueta como todas, pero poderosa. En el segundo ejemplo todos los panes son similares, por lo tanto, la desviaci√≥n est√°ndar es mucho m√°s peque√Īa. Eso significa que efectivamente a todos nos llega algo.
Nota: estamos a√ļn discutiendo la unidad de medida para la panitud.
La idea de fondo es que si la medida de dispersión es baja, los datos se parecen mucho al promedio (y, por lo tanto, se parecen mucho entre sí). Por el contrario, si la medida de dispersión es alta, los datos están alejados entre sí y es posible que el promedio no sea un resumen fiel de los datos. Esto es exactamente lo que pasa en los ejemplos de los panes y los sueldos: la desviación estándar es alta y, por lo tanto, los datos no se parecen al promedio.
La informaci√≥n que nos entrega la desviaci√≥n est√°ndar es √ļtil porque ayuda a pensar qu√© tan distintos son los casos que componen el promedio. Podemos poner en pr√°ctica lo aprendido con un ejemplo. Ac√° un acad√©mico intenta argumentar, con un gr√°fico, que existe una falla en el dise√Īo de Transantiago pues la mayor√≠a de los buses del Transantiago tienen muy baja ocupaci√≥n en la hora punta de la ma√Īana.
¬ŅProfesor de Estad√≠stica I?
Sin embargo, en el gráfico se muestra el promedio, la mediana y la desviación estándar. El promedio en este caso es de 26,16 pasajeros por bus, la mediana es 21 pasajeros por bus y la desviación estándar es de 21,83 pasajeros por bus. Notamos entonces que la desviación estándar es altísima, incluso similar al promedio. Por lo tanto, los datos no tienen por qué acercarse al promedio en general. El gráfico por sí solo no permite sacar conclusión alguna pues los datos presentan una dispersión demasiado grande.
Este tipo de distribuciones, así como el ejemplo del sueldo el Chile o del capital per cápita, son particularmente asimétricas. Es decir, existe una distribución muy desigual en la población o bien hay unos pocos casos con valores extremos que distorsionan las medidas de tendencia central. En todos los escenarios, pero especialmente en estos, es fundamental que las medidas de dispersión estén explicitadas en los datos.

Moraleja

No hay una sola forma de resumir los datos en un solo n√ļmero. El promedio es uno de los m√°s populares para comunicar, pero muchas veces no interpreta en forma correcta un conjunto de datos. Utilizar un promedio de esta forma puede causar desde errores jocosos a graves distorsiones en la comprensi√≥n de la realidad. La mediana se define como ¬ęel valor que divide a los datos en dos mitades¬Ľ y muchas veces es m√°s √ļtil mirar este valor en lugar del promedio.
¬ŅSignifica esto que el promedio es siempre in√ļtil? No, por supuesto que no. El promedio es sencillo, f√°cil de entender y entrega mucha informaci√≥n. El promedio es nuestro amigo. Pero ser√≠a aconsejable siempre acompa√Īar el promedio de la desviaci√≥n est√°ndar para evaluar si hay una gran dispersi√≥n de los datos (o sea, si la desviaci√≥n est√°ndar es alta). Es decir, un promedio explica bien una situaci√≥n si es acompa√Īado por una medida de desviaci√≥n peque√Īa: ex√≠jala a su periodista m√°s cercano.

Referencias

1.
OCDE, 2018. Income Distribution Database. Disponible en http://www.oecd.org/social/income-distribution-database.htm
2.
García P, Pérez C (2017). Desigualdad, inflación, ciclos y crisis en Chile. Estudios de Economía vol.44 no.2 Santiago dic. 2017. Disponible en https://scielo.conicyt.cl/scielo.php?pid=S0718-52862017000200185&script=sci_arttext&tlng=en
3.
Cabieses B et al (2017). Brechas de desigualdad en salud en ni√Īos migrantes versus locales en Chile. Revista chilena de pediatr√≠a vol.88 no.6 Santiago dic. 2017. Disponible en https://scielo.conicyt.cl/scielo.php?pid=S0370-41062017000600707&script=sci_arttext