Dentro del proyecto SAPIENS en el que se prevé desarrollar una serie de algoritmos predictivos sobre indicadores económicos y sociales, hemos desarrollado un modelo de predicción de la resolución de una llamada de emergencia en función del la zona en la que llama y la descripción que da el ciudadano.

Virginia Beach es una ciudad situada en la costa este de los Estados Unidos perteneciente al estado de Virginia que según la página web de la Oficina del Censo de los Estados Unidos, en abril de 2010  tenía una población de 437.994.

Esta ciudad tiene un gran catálogo de datos abiertos por lo que decidimos obtener los datos de esta ciudad para desarrollar nuestro algoritmo predictivo.

Con este estudio se pretende que los recursos que se apliquen en los servicios para resolver la llamada, sean lo más eficiente posible, dado que nos puede permitir asignar recursos más apropiados en función de la problemática que explica la persona que llama. Esto es importante, porque no siempre, la descripción indicada corresponde al problema real que se encuentran los servicios de emergencia.

Descripción

El dataset consta de 766.036 llamadas recogidas desde el 1 de enero de 2016 hasta el 15 de marzo de 2018 por los operadores.

En cada llamada se registraban los siguientes campos:

  • Número de Incidente
  • Número de Informe
  • Descripción de Llamada
  • Zona
  • Resolución de la Llamada
  • Prioridad
  • Subdivisión
  • Fecha y Hora: de la Llamada, de la Entrada de la Llamada, de ejecución, de la ruta, de presencia en Escena, que terminó la acción.
  • Localización

 

Análisis Exploratorio

Muchas llamadas pueden ser duplicadas (imaginemos un incendio, muchas llamadas recibidas serán comunicando este hecho), también se da el caso, que no todas las llamadas sean una emergencia, es decir, que se hubiera llamado para pedir información o se hubiera marcado el número de teléfono por error, en cuyo caso no se activan los protocolos para resolver la llamada.

Por estos motivos hemos filtrado y hecho limpieza de los datos para eliminar aquellas anomalías que puedan generar resultados no concluyentes.

También se debe entender bien en que momentos se a priorizar los recursos para atender las emergencias. En otras palabras, se puede dar el caso que la centralita se colapse por llamadas duplicadas, haciendo que una llamada de emergencia permanezca en cola o llegue a perderse por otro motivo, como puede ser un infarto o un atraco.

Para ello, hemos analizado qué variables son las más influyentes a en el momento de resolución de una llamada y hemos creado nuevas variables para optimizar los cálculos.

Análisis Predictivo

A partir de las variables del dataset, y una vez identificadas las variables que más influyen.

Hemos creado tres modelos para analizar cual de ellos y en qué condiciones tiene una mejor porcentaje de acierto del tipo de emergencia ocurrirá.

Los modelos que hemos utilizado han sido tres:

  • Naive Bayes: Obtiene una precisión de 71,47 % con una exactitud de 95,92%
  • Random Forest: Proporciona una precisión de 72,03 % con una exactitud de 96,00%
  • Support Vector Machine (SVM): Consigue una precisión de 74,18 % con una exactitud de 96,31%

 

Resultados algoritmos predicción llamada

 

Conclusión

Teniendo en cuenta que los datos utilizados son directamente los que se publican en datos abierto y, por consiguiente, no se dispone de una información con la suficiente calidad, el algoritmo desarrollado permite predecir el resultado de una llamada de urgencia con una precisión superior al 71%.

Todos los modelos desarrollados tienen un cierto margen de error, sin embargo, no todos los modelos se «equivocan» en los mismos conceptos. El proyecto nos ha permitido no sólo desarrollar varios modelos de predicción, sino también identificar bajo qué condiciones funciona mejor, lo cual permitiría elegir el más adecuado en función de que tipo de predicciones queremos asegurar.