Skip to content

El poder de la visualización de datos

Share on twitter
Share on linkedin
Share on email
Share on whatsapp
El poder de la visualización de datos

¿Qué es la visualización de datos?

Podríamos definir la visualización de datos como el conjunto de técnicas que permiten transformar los datos en elementos visuales que dan lugar a comprender la información subyacente en dichos datos. De esta manera podemos detectar tendencias, valores anómalos o patrones de un vistazo y sin tener que ver la totalidad de los datos.

Es bien sabido que el mundo de los datos está en plena ebullición. Somos partícipes de un cambio de paradigma en el que los datos han pasado de ser escasos y costosos a baratos y abundantes. En este sentido, la visualización juega un papel fundamental ya que se ha convertido en una forma fácil y rápida de sacar valor a los datos sin necesidad de hacer uso de técnicas de Machine Learning.

Importancia de la visualización

A veces puede resultar difícil explicar cuán importante puede llegar a ser la visualización de los datos, por ello vamos a ver algunos ejemplos. 

Mismos estadísticos, distinta gráfica

Quizá el caso más famoso, y no por ello menos curioso, sea el del Datasaurus. Se trata de un ejemplo en el que se visualizan varios conjuntos de datos que son, a priori, iguales. Estos conjuntos  incluso tienen la misma media, desviación típica y correlación. Una vez los representamos vemos que distan mucho de ser semejantes, conclusión a la que nunca hubiéramos llegado si nos hubiéramos quedado tan solo con los estadísticos básicos.

Coropletas, toda la información de un vistazo

En los tiempos que corren, puede que alguien esté interesado en los casos de Covid-19 en los municipios andaluces. Podría resultar tedioso consultar la cifra de contagiados para cada uno de los 786 municipios. En cambio, mediante un visor cartográfico podemos, de un vistazo, hacernos una idea de la situación en toda la comunidad, incluso podemos dotar de interactividad al mapa.

En este sentido, en la serie de artículos Café con IOT de nuestro blog podemos ver otro claro ejemplo relacionado con el consumo de café de los empleados.

Graficar series temporales para identificar tendencias

De la misma manera, podríamos estar interesados en comprobar los meses en los que el virus ha tenido mayor impacto, y a la vez ver la comparativa para dos provincias. Este estudio viendo los datos en bruto sería lento y complicado. Sin embargo, en el siguiente gráfico podemos acceder a toda esa información de manera rápida y entendible.

Mala praxis en visualización de datos

Parece claro que la visualización de datos es una herramienta muy potente para la comprensión de los mismos, pero como se suele decir: un gran poder conlleva una gran responsabilidad. Es una herramienta tan útil como peligrosa ya que, en muchos casos, deliberadamente o no, las visualizaciones van ligadas a una manipulación de la información. Además, debido a tremenda actividad que existe hoy en día en redes sociales, esto puede llegar a fomentar bulos, desinformación, y un largo etcétera de controversias. 

No es difícil encontrar por la red ejemplos de visualizaciones engañosas. Vamos a comentar a continuación alguna de ellas.

Ejes invertidos

Invertir alguno de los ejes de la gráfica resulta una acción que, si no tenemos cuidado, puede resultar muy engañosa en ciertos contextos. A continuación comentamos uno de los ejemplos más famosos.

En 2005 el estado de Florida aprobó la ley «Stand Your Ground». Dicha ley, en resumidas cuentas, permite a los ciudadanos el uso de armas para su defensa en determinadas circunstancias. Como podemos observar, en la gráfica emitida por el departamento legal de dicho estado, se trata de representar la evolución de los asesinatos por arma de fuego antes y después de la aprobación de dicha ley. Alguien que no repare en el detalle de la inversión del eje de ordenadas, podría pensar que las muertes han bajado desde la aprobación de la ley. En cambio, si devolvemos el eje a su posición natural, nos damos cuenta de que la tendencia no es ni mucho menos decreciente.

Simpleza y legibilidad

A veces, a la hora de desarrollar un gráfico tendemos a pensar que debe ser impresionante y vistoso. Sin embargo, en la mayoría de las ocasiones un gráfico simple y legible puede transmitir la misma o incluso más información. Y es que, como vemos en este ejemplo, si nos obstinamos en nuestro empeño de hacer un gráfico vistoso, podemos pecar de que el gráfico deje de cumplir su objetivo principal, el entendimiento de los datos.

gráfica en tornado

Representaciones no fieles a la escala

Como vemos en los dos ejemplos, una representación de los datos que no se ajuste a la escala puede dar lugar a equívoco.

En el primero de los gráficos las dos primeras barras parecen normales. En cambio, las tres últimas deberían estar mucho más cerca de 15.000 que de 10.000. Con esto se consigue que la subida de los casos no parezca tan abrupta.

Algo similar ocurre en el segundo ejemplo, podemos observar que por ejemplo, 218 está situado por debajo de 165, dando así la sensación de que los casos están aumentando.

Tips para una buena visualización

Para tratar de evitar este tipo de manipulaciones aquí va una serie de tips de visualización:

  • La creatividad es un grado en la visualización de datos, tenemos que buscar formas de dotar de nuevas dimensiones al gráfico. Para ello se pueden usar colores, formas, tamaños…
  • Tener claro el público al que va dirigido. Por ejemplo, las escalas logarítmicas son útiles, pero no todo el mundo las entiende.
  • Una leyenda siempre favorece la comprensión.
  • Lo mismo ocurre con los colores. En este sentido conviene: usar paletas de colores amigables a la vista, que los colores vayan asociados a los datos con cierta coherencia (por ejemplo estamos muy acostumbrados a asociar rojo a negativo y verde a positivo)…
  • Numerosos estudios avalan que el ser humano es muy malo distinguiendo ángulos. Por ello un diagrama de barras siempre será mejor que un  gráfico de tarta.
  • Tener claro el objetivo. Podemos encontrar numerosos esquemas que nos llevan a la mejor representación en cada caso como vemos a continuación:

Teniendo en cuenta los puntos aquí comentados, se simplificará el proceso de diseño de infografías que sean realmente útiles para la audiencia.

En conclusión, una buena visualización debe comunicar un conjunto de datos de forma clara y eficaz. Dicho esto, citar al precursor de uno de los gráficos más usados hoy en día, como son los diagramas de cajas, me parece una forma redonda de cerrar este artículo. Y es que, como dijo John Tukey: «The greatest value of a picture is when it forces us to notice what we never expected to see».

Comparte el artículo

Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on email
Email
Share on whatsapp
WhatsApp

Una nueva generación de servicios tecnológicos y productos para nuestros clientes