La resolución de problemas ha sido una de las capacidades innatas de los seres humanos. Desde nuestros días primitivos, cuando nuestro mayor desafío en la vida era no ser devorado por una bestia depredadora, hasta los tiempos contemporáneos, cuando era necesario que nos entregaran algo rápido a casa, hemos combinado nuestra creatividad, razonamiento lógico e inteligencia para encontrar soluciones a los conflictos.
Ahora que somos testigos del surgimiento de seres sintientes con inteligencia artificial, nos enfrentamos a nuevos desafíos en lo que respecta a sus capacidades de toma de decisiones. Si bien en la década anterior se trató de celebrar las posibilidades y el potencial de los modelos y aplicaciones de inteligencia artificial, en esta década se trata de ir un paso más allá: cuestionar la legitimidad de las decisiones que toman esos modelos y deducir el razonamiento que las sustenta.
A medida que la inteligencia artificial explicable (XAI) gana más importancia, este es el momento de discutir un concepto clave en el desarrollo de modelos de IA que llamamos Incitación a la cadena de pensamientosEn este artículo, descifraremos y desmitificaremos en profundidad lo que esto significa y los términos simples.
¿Qué es la estimulación en cadena de pensamientos?
Cuando la mente humana se enfrenta a un desafío o a un problema complejo, intenta dividirlo en fragmentos de pasos secuenciales más pequeños. Impulsada por la lógica, la mente establece conexiones y simula escenarios de causa y efecto para diseñar la mejor solución posible para el desafío.
El proceso de replicar esto en un modelo o sistema de IA es Instigación de cadena de pensamiento.
Como sugiere el nombre, un modelo de IA genera una serie o cadena de pensamientos lógicos (o pasos) para abordar una consulta o un conflicto. Imagínese que esto es como dar instrucciones paso a paso a alguien que pide una ruta para llegar a un destino.
Esta es la técnica predominante que se utiliza en los modelos de razonamiento de OpenAI. Como están diseñados para pensar antes de generar una respuesta, han podido superar exámenes competitivos realizados por humanos.
[También lea: Todo lo que necesitas saber sobre LLM]
Beneficios de las indicaciones en cadena de pensamientos
Todo lo que se basa en la lógica ofrece una ventaja significativa. De manera similar, los modelos entrenados con estímulos de cadena de pensamiento ofrecen no solo precisión y relevancia, sino también una amplia gama de beneficios, entre ellos:
Modernizado la resolución de problemas capacidades, donde su importancia es crítica en campos como la atención médica y las finanzas. Los LLM que utilizan la inducción de cadenas de pensamiento comprenden mejor los desafíos explícitos y subyacentes y generan respuestas después de considerar distintas probabilidades y escenarios de peor caso.
Mitigante supuestos y resultados generados a partir de suposiciones porque los modelos aplican el pensamiento y el procesamiento lógico y secuencial para concluir en lugar de sacar conclusiones apresuradas.
Aumento de versatilidad ya que los modelos no necesitan ser entrenados rigurosamente en un nuevo caso de uso ya que se rigen por la lógica y no por un propósito.
Optimizado coherencia en tareas que implican respuestas de varias partes o de varias preguntas.
Anatomía del funcionamiento de la técnica de incitación por cadena de pensamientos
Si está familiarizado con la arquitectura de software monolítica, sabrá que toda la aplicación de software se desarrolla como una única unidad coherente. La simplificación de un problema tan complejo llegó con el método de arquitectura de microservicios, que implicó la división del software en servicios independientes. Esto dio como resultado un desarrollo más rápido de los productos y también una funcionalidad perfecta.
Incitación a la CoT en IA Es similar, ya que los LLM son guiados a través de una serie de procesos secuenciales de razonamiento para generar una respuesta. Esto se hace a través de:
- Instrucciones explícitas, donde se instruye directamente a los modelos para que aborden un problema secuencialmente mediante comandos sencillos.
- La instrucción implícita es más sutil y matizada en su enfoque. En ella, se lleva a un modelo a través de la lógica de una tarea similar y se aprovechan sus capacidades de inferencia y comprensión para replicar la lógica de los problemas presentados.
- Ejemplos demostrativos, donde un modelo presentaría un razonamiento paso a paso y generaría conocimientos incrementales para resolver un problema.
3 casos reales en los que se utiliza la incitación de CoT
Modelos de decisión financiera
| CoT multimodal en bots
| Servicios de salud
|
---|---|---|
En este sector altamente volátil, la información sobre el CoT se puede utilizar para comprender la trayectoria financiera potencial de una empresa, realizar evaluaciones de riesgo de los solicitantes de crédito y más. | Los chatbots que se desarrollan e implementan para empresas exigen funcionalidades específicas. Deben demostrar capacidades para comprender diferentes formatos de entradas. La incitación de CoT funciona mejor en esos casos, donde los bots deben combinar indicaciones de texto e imágenes para generar respuestas a las consultas. | Desde el diagnóstico de pacientes a partir de datos de atención médica hasta la generación de planes de tratamiento personalizados para los pacientes, la estimulación CoT puede complementar los objetivos de atención médica de clínicas y hospitales. |
Ejemplo
Consulta del cliente: He detectado una transacción en mi cuenta que no reconozco, he perdido mi tarjeta de débito y quiero configurar alertas para las transacciones de mi cuenta. ¿Pueden ayudarme con estos problemas?
Paso 1: Identificar y categorizar los problemas
- Transacción no reconocida.
- Tarjeta de débito perdida.
- Configuración de alertas de transacciones.
Paso 2: Abordar la transacción no reconocida
Solicite detalles: ¿Podría proporcionarme la fecha y el monto de la transacción?
- Rama 1: Si se proporcionan detalles:
- Revise la transacción. Si es fraudulenta, pregunte al cliente si desea impugnarla.
- Rama 2: Si no hay detalles:
- Ofrecer proporcionar una lista de transacciones recientes.
Paso 3: Abordar la tarjeta de débito perdida
Congelar la tarjeta: Se recomienda congelar inmediatamente.
- Rama 1: Si el cliente está de acuerdo:
- Congela la tarjeta y pregunta si quieren una de reemplazo. Confirma la dirección de envío.
- Rama 2: Si el cliente rechaza:
- Se recomienda monitorear la cuenta para detectar transacciones no autorizadas.
Paso 4: Configurar alertas de transacciones
Elija el método de alerta: ¿SMS, correo electrónico o ambos?
- Rama 1: Si un cliente elige:
- Configura alertas para transacciones que superen un monto específico. Solicita el monto.
- Rama 2: Si no está seguro:
- Sugiera una cantidad predeterminada (por ejemplo, $50) y confirme.
Paso 5: Proporcionar un resumen y los próximos pasos
- Investigando la transacción no reconocida.
- Congelar la tarjeta de débito y posiblemente emitir un reemplazo.
- Configurar alertas de transacciones según se solicite.
Justificación:
Este proceso aborda de manera eficiente múltiples consultas de los clientes a través de pasos claros y ramas de decisión, garantizando soluciones integrales.
Limitaciones de la estimulación CoT
La cadena de pensamiento es, sin duda, eficaz, pero también está sujeta al caso de uso en el que se aplica y a varios otros factores. Existen desafíos específicos asociados con indicaciones de CoT en IA que impiden a las partes interesadas aprovechar al máximo su potencial. Veamos los obstáculos más comunes:
Complicar demasiado las tareas sencillas
Si bien las indicaciones de CoT funcionan mejor para tareas complejas, pueden complicar las tareas simples y generar respuestas incorrectas. Para las tareas que no requieren razonamiento, los modelos de respuesta directa funcionan mejor.
Aumento de la carga computacional
El procesamiento de las indicaciones de CoT requiere una carga computacional significativa y, si la técnica se implementa en modelos más pequeños que se construyen con capacidades de procesamiento limitadas, puede sobrecargarlos. Las consecuencias de tales implementaciones pueden incluir tiempos de respuesta más lentos, poca eficiencia, incoherencia y más.
Calidad de la ingeniería de IA
Incitación a la CoT en IA Funciona bajo el supuesto (o principio) de que una indicación específica está bien articulada, estructurada y es clara. Si una indicación carece de estos factores, la indicación CoT pierde la capacidad de captar el requisito, lo que da como resultado la generación de pasos secuenciales irrelevantes y, en última instancia, de respuestas.
Capacidades reducidas a escala
Las partes interesadas pueden experimentar dificultades con sus modelos si tienen que aprovechar la incitación por cadenas de pensamiento para volúmenes masivos de conjuntos de datos o complejidades de problemas. Para tareas que implican pasos de razonamiento más grandes, la técnica puede ralentizar el tiempo de respuesta, lo que la hace inadecuada para aplicaciones o casos de uso que exigen la generación de respuestas en tiempo real.
La estimulación CoT es una técnica fenomenal para optimizar el rendimiento de Modelos de lenguaje grandeSi se pueden abordar y resolver estas deficiencias mediante técnicas de optimización o soluciones alternativas, se pueden obtener resultados increíbles. A medida que avance la tecnología, será interesante ver cómo evoluciona la incitación por cadena de pensamiento y se vuelve más sencilla, pero también más específica.