Errores comunes en la visualización
En los últimos días se ha hecho viral una imagen sobre representación gráfica de los resultados de una encuesta.
Lo que más ha llamado la atención es que los resultados suman más del 100% algo que es imposible y que el gráfico no mantiene las proporciones (hay mucha menos distancia entre las barras de Pablo Iglesias y Mariano Rajoy teniendo 7 puntos de diferencia que entre Pedro Sánchez y Albert Ribera separados por 9 puntos).
La imagen viral con el gráfico erróneo |
Pero más allá del error de los datos o la representación por haber hecho los gráficos manualmente, hay otros errores comunes a la hora de visualizar la información.
Ejes Cortados
En el siguiente gráfico, el eje de las Y se ha cortado haciendo que empiece en 6000 en lugar de en el origen 0.
Evolución desproporcionada |
Cortar los ejes es un recurso bastante común para dar más vistosidad a los gráficos y para que se aprecien mejor las diferencias, pero ese mismo hecho puede provocar malas interpretaciones debido a que da la sensación de cambios mucho mayores de lo que realmente son.
Para informar correctamente de la magnitud de la variación deberíamos poner siempre el eje de las ordenadas a origen.
Evolución proporcionada mostrando el origen del eje Y |
En todo caso, si se prefiere la primera visión en el mismo gráfico debería indicarse que los datos no están representados a origen.
No utilizar anotaciones
Es fundamental que los gráficos expliquen lo que ha pasado. Un gráfico en el que únicamente hay una línea de puntos explicará qué ha pasado pero no por qué.
En este sentido, es necesario añadir anotaciones a los gráficos para indicar determinados hechos o decisiones tomadas, de esta manera, la persona que analiza la información está situada en contexto y puede aprender como afectan determinados hechos.
Evolución con etiquetas y línea de corte del eje Y |
Si quieres saber cómo hacer anotaciones dinámicas en los gráficos de Atlas SBI, puedes leer el siguiente artículo.
Dificultad para comparar
En esta categoría se engloban lamentablemente los gráficos más espectaculares y en general los que más gustan, me refiero a los gráficos tridimensionales y los de tarta.
En el primero de los casos resulta obvio que pese a la vistosidad del gráfico, es imposible comparar cómo han evolucionado todas las series puesto que unas ocultan a las otras.
Los gráficos de tarta merecen un capítulo aparte, en general, sólo funcionan correctamente cuando hay pocos sectores (entre 3 y 5) y son relativamente diferentes (por ejemplo representando la serie de valores: 40, 25, 15, 10). En este caso, sí que se podrá apreciar la diferencia entre cada uno de los sectores.
Sin embargo, cuando se generan gráficos a partir de selecciones sobre bases de datos, normalmente aparecen muchos sectores y en la mayoría de los casos, siguiendo la ley de Pareto, el 80% de las opciones son muy pequeñas y no se pueden distinguir.
Pero también en casos en los que hay pocos sectores se produce confusión si no tienen valores claramente diferenciados.
Gráficos de tartas |
Personalmente prefiero utilizar siempre las barras apiladas al 100% de esta forma, obtenemos la misma representación pero con mucha más información y ocupando mucho menos espacio.
Como puede verse en el siguiente gráfico (que representa los mismos datos que en el gráfico anterior de tarta) el hecho de poner las series apiladas una al lado de la otra permite apreciar que el porcentaje de incidencias sobre pedidos es menor en ‘Cargo normal’, cosa que es imposible en un gráfico de tartas.
Barras apiladas al 100% |
Por supuesto, la forma correcta de representarlo es añadir información numérica al gráfico que permita comprender mejor los datos.
Barras apiladas al 100% con etiquetas |
No utilizar el tipo adecuado
Básicamente con un gráfico se pueden representar dos conceptos: Evolución y Distribución.
La evolución explica como un determinado indicador varía a lo largo del tiempo. El tipo de gráfico más apropiado es el de líneas (con todas sus variantes: áreas, acumuladas, …).
La distribución explica cómo se segmenta un determinado indicador, por ejemplo, ventas por provincia, pirámides de edad, … En este caso, los tipos adecuados para su representación pueden ser las barras (con sus variantes) o los gráficos de tarta (con las salvedades indicadas en el punto anterior).
Ejemplo de distribuciones y evoluciones |
Cabe destacar que para facilitar la lectura o enfatizar algún aspecto, podemos utilizar las barras para las evoluciones, pero nunca deberíamos utilizar las líneas para las distribuciones puesto que dan la sensación de continuidad.
Xavier Plaza - author
Ingeniero superior en informática y Executive MBA, experiencia en Business Intelligence, Machine Learning, dirección de empresas, desarrollo de proyectos informáticos y experiencia real en la administración pública.
Categorías
- Blog (6)
- Conocimiento (31)
- Gestión (17)
- Historias (24)
- Sectores (17)
- Adm. Pública (16)
- Tecnologías (3)
- Uso de Atlas SBI (5)
- Sectores (17)
- Machine Learning (5)
- LLM/GPT (3)
- Noticias (24)
- Proyectos (33)
- SAPIENS (12)
- SapiensXBot (4)
- Vídeos (20)
- General/Usuario (8)
- Técnico avanzado (5)
- Técnico Básico (7)
Deja un comentario