En nuestros días, el análisis estadístico se ha convertido en un método efectivo para describir los valores de datos económicos, políticos, sociales, psicológicos, … y sirve como herramienta para predecir, relacionar y analizar dichos datos.

Ya en el año 2.000 Rao y Székely afirmaron que “La Estadística, en el marco de la sociedad del conocimiento y la información, tiene un gran porvenir en el siglo XXI”, en el mismo sentido, para Lent “Cada vez se abren más nichos de oportunidad para los principios, técnicas y procedimientos que forman el cuerpo de la metodología estadística”.

Hoy en día, algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella. Cada día se genera una gran cantidad de información que pueden ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir o tomar decisiones de cualquier ámbito.

Para llevar a cabo un buen análisis es indispensable disponer de una considerable cantidad de datos, tanto actuales como pasados, para poder establecer patrones de comportamiento y así tomar buenas decisiones empresariales.

Se puede distinguir diferentes tipos de análisis de datos en función de cuál sea el objetivo al realizarlo:

  • Descriptivo
  • Exploratorio
  • Inferencial
  • Predictivo
  • Casual
  • Mecanicista

Análisis Descriptivo

Es el más sencillo. Tiene como fin describir un conjunto de datos, obteniendo así los parámetros que distinguen las características de un conjunto de datos.

Por ejemplo, se puede saber el número de ventas realizados, el número nuevo de clientes, número de productos que se tiene en stock.

Los motivos para realizar este análisis son que permite conocer al detalle la información que se posee y conocer la forma en la que se estructura la información. Se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos.

 

Análisis Exploratorio

Consiste en un conjunto de técnicas estadísticas cuya finalidad es conseguir un entendimiento básico de los datos, permitiendo detectar características sobresalientes, como inesperadas y valores atípicos.

Por ejemplo, en que sucursal se vende más, de que producto hay más stock, qué diferencias hay entre el producto más vendido y el menos vendido, saber si hay diferencias económicas significativas por barrios, …

Este análisis debe ser la primera etapa de todo análisis de datos, para evitar que datos erróneos o inesperados sean procesados de modo inapropiado. Se apoya en un planteamiento descriptivo y se realiza sin aceptar ideas preconcebidas sobre el contenido de la información de los datos.

La aplicación de este análisis permite estudiar la tendencia, distribución y forma de cada uno de los indicadores, estudiar la normalidad sobre un conjunto de indicadores y si este criterio no se cumpliera, este análisis orienta sobre el tipo de transformación que se debe someter a los datos.

El análisis exploratorio permite definir hipótesis que deberán ser demostradas con un análisis inferencial.

 

Análisis Inferencial

Pretende demostrar hipótesis planteadas proporcionando conclusiones con una cierta probabilidad o nivel de confianza, es decir no existe una certeza absoluta.

Por ejemplo, se puede plantear la hipótesis que los clientes que compran un determinado producto son familia numerosa (y por consiguiente candidatos a comprar otros productos complementarios). O el día que se vende el producto estrella el cliente consume menos de otros productos.

Es importante destacar, que para realizar el análisis inferencial, no se debe utilizar el mismo conjunto de datos (dataset) que se usó para generar la hipótesis (utilizado en el análisis exploratorio) puesto que habría sesgo y las conclusiones podrían no ser válidas.

 

Análisis Predictivo

Se fundamenta en la identificación de relaciones entre variables en eventos pasados, para luego explotar dichas relaciones y predecir posibles resultados en futuras situaciones.

Por ejemplo, qué cantidad stock que se debe tener en el almacén para cada producto, o a partir de los datos del padrón que tipo de ayudas/servicios se solicitarán a un ayuntamiento el año que viene.

Cabe destacar que, mientras el análisis inferencial se preocupa de entender y demostrar la relación, el análisis predictivo sólo se preocupa del valor, y no busca en ningún caso entender el sistema o la relación entre elementos.

Este factor lo hace especialmente interesante para problemas complejos con gran cantidad de variables influyentes o de difícil comprensión para la mente humana que abarcan desde el genoma humano, a sistemas de recomendaciones en función de preferencias de usuarios pasando por la detección de texto, el modelado de redes sociales o incluso la conducción autónoma.

En este proceso se hace uso de los datos junto con técnicas analíticas, estadísticas y de aprendizaje automático a fin de crear un modelo predictivo. Se desarrolla el modelo mediante un conjunto de datos de entrenamiento y después se prueba (con un conjunto de datos diferente) y se valida para determinar su precisión.

 

Análisis Causal

Permite relacionar las causas con los efectos y el grado en el que se afectan mutuamente.  En este nivel se puede predecir y además se puede identificar el por qué se actúa de esa manera.

Es decir, con el análisis inferencial podemos afirmar que el día en que más se vende el producto estrella se vende menos del resto de productos, pero no nos dice si vendiendo menos de ese producto subirán las ventas del resto, en otras palabras, el análisis inferencial nos dice que ha relación, pero para saber la causa hemos de hacer un análisis causal.

El uso de técnicas de modelado e inferencia causal es clave para investigar y resolver eficazmente problemas que resultan ser la causa de incidencias que están afectando a uno o varios servicios.

 

Análisis Mecanicista

Es el más complejo. En este análisis se puede predecir y comprender como varias variables afectan entre ellas, cómo el cambio de los valores de una de las variables afectan, no ya al resultado sino al resto de variables. Debido a su complejidad se utiliza muy poco ya que se debe tener un gran conocimiento de los procesos a modelar.

Permitirían saber por ejemplo, si el incremento en la inversión en publicidad y un aumento de plantilla en el departamento de marketing influye en el incremento de ventas y como ésta influye en las dos anteriores.

 

Finalmente, y a modo de resumen es importante destacar que el mismo conjunto de datos puede responder a diferentes preguntas de diferentes tipos con diferentes métodos de análisis estadístico.