Actualmente, las principales alternativas para desarrollar chatbots empresariales que utilicen Inteligencia Artificial (IA) son el uso de Plataformas NLP y la geneneración mediante modelos de lenguaje GPT (Generative Pre-trained Transformer).

En este artículo realizamos una comparativa entre estas dos alternativas, analizando las ventajas e inconvenientes de cada una de ellas.

Plataformas NLP vs. Modelos de Lenguaje GPT

Un ejemplo de Plataforma NLP es SapiensXBot y son, fundamentalmente, arquitecturas de procesamiento y comprensión del lenguaje natural (NLP y NLU, por sus siglas en inglés, respectivamente).

Estas plataformas están diseñadas para comprender y procesar el lenguaje humano, identificando las intenciones detrás de las consultas de los usuarios y extrayendo entidades relevantes. Para ello es necesario entrenarlas con una gran cantidad de ejemplos para que sean capaces de identificar que es lo que se les está pidiendo.

Por su parte, la aparición de modelos de lenguaje GPT (como ChatGPT, Llama2 u otros open source que se pueden descargar desde Hugging Face), que destacan por su capacidad para comprender y generar texto de manera coherente y contextual, ha supuesto un cambio radical en la forma en que se desarrollan los chatbots tal como hemos comentado en LLM e Inteligencia Artificial Generativa.

Uso de modelos de lenguaje GPT

 

Ventajas:

Comprensión del lenguaje natural

Los LLM están entrenados con cientos de miles de millones de parámetros. Esto le permite entender y generar texto en contextos complejos sin necesidad de un entrenamiento específico para situaciones concretas.

Capacidad de aprendizaje

Continuamente están apareciendo modelos nuevos mejorados que podemos incorporar con pocos cambios a nuestros proyectos.

Multi-idioma

Los modelos más potentes (a partir de decenas de miles de millones de parámetros 13B y superiores) están entrenados en varios idiomas por lo que son capaces de comprender la pregunta independientemente del idioma en que se ha realizado y responder en el mismo idioma.

Escalabilidad

La escalabilidad viene determinada por el uso de una API pública para realizar las preguntas. Esto nos permite utilizar los modelos sin necesidad de tener que proveer una infraestructura compleja y cara que necesitará de ordenadores con varias GPUs.

Desventajas

Potenciales errores

Uno de los principales problemas de los models LLM son las llamadas «Alucinaciones». Como su propio nombre indica, la IA Generativa, se caracteriza por generar respuestas imaginativas a las preguntas.

Esta capacidad de inventarse la respuesta si no la conoce es muy peligrosa en caso de que necesitamos respuestas concretas y fiables en entornos de consulta de documentación interna o servicio de atención a clientes.

No pueden responder cualquier pregunta

Como hemos comentado en varias ocasiones, los modelos GPT están entrenados con miles de millones de parámetros y millones de documentos públicos (wikis, foros, libros,…) por lo que son capaces de responder a un número ilimitado de preguntas.

Sin embargo, las diferentes empresas y organizaciones disponen de una gran cantidad de información interna que son parte de su «know-how» y que no está disponible públicamente.

Toda esta información no se ha podido (ni seguramente se debe) utilizar en los entrenamientos, por lo que los modelos GPT no podrán responder a preguntas sobre estos temas.

Además, el entrenamiento de estos modelos es muy costoso en recursos, por lo que las actualizaciones, aunque constantes, no son frecuentes. Esto hace que no sepa responder a preguntas sobre novedades aparecidas después de su entrenamiento.

Costos de implementación

Existen dos planteamientos a la hora de implantar chatbots con modelos GPT, el pago por uso vía API y la utilización de modelos privados en infraestructura propia.

En el primero de los casos, el coste de inicio del proyecto es bajo, pero tiene un crecimiento lineal «infinito» en función de su uso.

Por el contrario, el uso de modelos privados requiere de una infraestructura costosa inicialmente debido a los requerimientos de GPU pero con un crecimiento logarítmico.

Uso de plataformas NLP

Ventajas

Flexibilidad y control total

Ofrecen un alto grado de flexibilidad y control sobre el desarrollo de chatbots. Por un lado, los desarrolladores pueden definir flujos de conversación personalizados y lógica empresarial compleja mediante la definición de historias.

Pero además, una vez identificada la intención, es posible llamar a APIs, ejecutar programas o consultar bases de datos para ofrecer una respuesta totalmente personalizada a las demandas del usuario.

Integración con plataformas externas

Se integra fácilmente con otros sistemas y plataformas, tanto a nivel de interfaz de usuario (canales) como a bases de conocimiento .

Por lo que respecta a los canales de entrada pueden ser la propia página web de la organización como redes sociales (Facebook, Telegram,…) u otros dispositivos (Alexa, Chat rooms, …)

Para obtener el conocimiento y generar la respuesta se pueden ejecutar aplicaciones, hacer llamadas a servicios webs o consultar bases de datos

Cumplimiento de normativas

El hecho de que la respuesta sea definida o generada mediante una programación previa, permiten un mayor control sobre la gestión de datos y la privacidad, lo que facilita el cumplimiento de regulaciones como el RGPD.

Desventajas:

Mayor complejidad de desarrollo

Dado que son una plataformas de desarrollo más técnica, puede requerir más tiempo y habilidades de desarrollo en comparación con herramientas de chatbot basadas en modelos GPT.

Desafíos en NLU

Aunque ofrecen capacidades de procesamiento de lenguaje natural (NLU), la calidad de las predicciones de NLU puede variar y puede requerir una cantidad significativa de datos y ajustes para lograr un alto rendimiento.

Conclusiones

El análisis comparativo entre las Plataformas NLP y los Modelos de Lenguaje GPT para la creación de chatbots nos muestra que la principal ventaja de los sistemas chatbot basados en modelos GPT es su facilidad para entender y generar respuestas en lenguaje natural sin un gran esfuerzo gracias a que los modelos han sido entrenados previamente con un gran volumen de datos. Por el contrario, este mismo hecho, provoca su principal desventaja: las alucinaciones.

Por su parte, la construcción de chatbots con Plataformas NLP requieren de un gran esfuerzo en entrenamiento para la comprensión de cualquier tipo de pregunta que se pueda realizar, pero una vez comprendida la intención del usuario la respuesta es más fiable, personalizada y segura.

 

Fotos de Google DeepMind: https://www.pexels.com/es-es/foto/18069814/ y https://www.pexels.com/es-es/foto/18069695/, resto de imágenes de producción propia