RAG vs. Ajuste fino

RAG vs. Fine-Tuning: ¿Cuál se adapta mejor a tu LLM?

Los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés), como GPT-4 y Llama 3, han afectado al panorama de la IA y han logrado grandes avances en áreas que van desde el servicio al cliente hasta la generación de contenido. Sin embargo, adaptar estos modelos a necesidades específicas generalmente implica elegir entre dos técnicas poderosas: la generación aumentada por recuperación (RAG, por sus siglas en inglés) y el ajuste fino.

Si bien ambos enfoques mejoran los LLM, están orientados a diferentes objetivos y son exitosos en diferentes situaciones. Estudiemos estos dos métodos en detalle, sus ventajas y desventajas, y cómo elegir uno para sus necesidades.

Recuperación-Generación Aumentada (RAG): ¿Qué es?

¿Qué es un trapo?

RAG es un enfoque que sinergiza la generación Capacidades de los LLM con recuperación de respuestas contextualmente precisas. En lugar de utilizar únicamente el conocimiento sobre el que se puso a prueba, RAG obtiene información relevante a través de bases de datos externas o repositorios de conocimiento para incorporar la información en el proceso de generación de respuestas.

Cómo funciona RAG

Cómo funciona el trapo

  1. Modelo de incrustación: Incorpora tanto los documentos como las consultas en el espacio vectorial para hacer una comparación más eficiente.
  2. Perdiguero:Busca en una base de conocimientos a través de incrustaciones para obtener documentos relevantes.
  3. Reclasificador: Califica los documentos recuperados según su relevancia.
  4. Modelo de lenguaje: Fusiona los datos recuperados con las consultas de un usuario en una sola respuesta.

Ventajas del RAG

  • Actualizaciones dinámicas de conocimientos: Proporciona una transmisión eficiente de información con los procesos de actualización reducidos en gran medida a través del proceso de reentrenamiento del modelo.
  • Reducción de la alucinación: Al fundamentar adecuadamente las respuestas en el conocimiento externo, RAG minimiza las imprecisiones fácticas.
  • Escalabilidad: Se puede integrar fácilmente en conjuntos de datos grandes y diversos, lo que permite opciones para tareas abiertas y dinámicas útiles, como agentes de clientes y resúmenes de noticias.

Limitaciones de RAG

  • Estado latente: La propia atención en la extracción de información retrasa el tiempo de salida lo que genera mayor latencia y lo hace irrelevante para entornos de trabajo en tiempo real.
  • Calidad de la base de conocimientos: La confiabilidad en la recuperación y relevancia del conocimiento externo se vuelve importante ya que las respuestas dependen únicamente de estas fuentes.

Ajuste fino: ¿Qué es?

¿Qué es el ajuste fino?

El ajuste fino es un proceso de reentrenamiento de un LLM previamente entrenado en un conjunto de datos de dominio específico en la preparación de la ejecución de una tarea especializada, lo que permite que el modelo comprenda completamente los patrones matizados que existen dentro del límite de un contexto determinado.

Cómo funciona el ajuste fino

Cómo funciona el ajuste fino

  • Preparación de datos: Los conjuntos de datos específicos de la tarea deberán limpiarse y reservarse en subconjuntos de entrenamiento, validación y prueba.
  • Entrenamiento modelo: El LLM tendrá que entrenarse en este conjunto de datos con métodos que incluyan retropropagación y descenso de gradiente.
  • Contenido del ajuste de hiperparámetros: Proporciona un ajuste fino de algunos de los contenidos de hiperparámetros críticos, como el tamaño del lote y la tasa de aprendizaje, entre otros.

Ventajas del ajuste fino

  • Personalización: Permite a las autoridades controlar las acciones, el tono y el estilo del modelo en los resultados.
  • Eficiencia en la inferencia: Cuando un LLM ha sido perfeccionado, produce respuestas rápidas sin ningún proceso de recuperación externo.
  • Conjunto de habilidades especializadas: Más adecuado para aplicaciones que requieren calidad y precisión en dominios bien conocidos, como congelación, evaluaciones médicas y análisis de contratos.

Desventajas del ajuste fino

  • Muchos recursos: Requiere tanto una gran potencia de cálculo como datos etiquetados de la más alta calidad.
  • Olvido catastrófico: El ajuste fino tiende a sobrescribir el conocimiento genérico adquirido previamente y, por lo tanto, limita su potencial para satisfacer nuevas tareas.
  • Base de conocimientos estática: Una vez completado el entrenamiento, su conocimiento permanece intacto a menos que se vuelva a enseñar con nuevos datos adicionales.

Diferencias clave entre RAG y ajuste fino

FeatureGeneración aumentada de recuperación
(TRAPO)
Sintonia FINA
Fuente de conocimiento
Bases de datos externas (dinámicas)Internalizado durante el entrenamiento (estático)
Adaptabilidad a nuevos datosAlto; actualizaciones a través de fuentes externasBajo; requiere reentrenamiento
Estado latenteMayor debido a los pasos de recuperaciónBaja; generación de respuesta directa
PersonalizaciónLimitado; depende de datos externosAlto; adaptado a tareas específicas
EscalabilidadSe escala fácilmente con grandes conjuntos de datosUso intensivo de recursos a gran escala
Ejemplos de casos de usoPreguntas y respuestas en tiempo real, verificación de datosAnálisis de sentimientos, tareas específicas del dominio

Cuándo elegir RAG o ajuste fino

Área de aplicación que necesita información en tiempo real 

Si la aplicación necesita información actualizada en tiempo real, se debe utilizar RAG: sistemas de resumen de noticias y atención al cliente que se basan en datos que cambian rápidamente. Ejemplo: un asistente virtual que obtiene actualizaciones en tiempo real, como precios de acciones y datos meteorológicos.

Experiencia en el campo

Cuando se requiere un ajuste fino para lograr precisión en un dominio limitado, se puede optar por el ajuste fino en las áreas de revisión de documentos legales y análisis de textos médicos. Ejemplo: un modelo ajustado entrenado en literatura médica para su uso en el diagnóstico de enfermedades según las notas de los pacientes.

Escala

RAG es un motor de búsqueda destacado en cuanto a escalabilidad para consultas abiertas en nuestro espacio, que extrae los resultados de diferentes bases de conocimiento de forma dinámica. Ejemplo: un motor de búsqueda con respuestas de casos reales que proporciona comentarios de múltiples industrias sin necesidad de volver a entrenar.

Disponibilidad de recursos

El ajuste fino puede ser una mejor opción general para casos de uso a menor escala en los que un conjunto de datos estáticos sería suficiente. Ejemplo: un bot entrenado en un conjunto de preguntas frecuentes que utiliza internamente una empresa.

Tendencias emergentes

  1. Enfoques híbridos: Combinando RAG con minimización, lo mejor de ambos mundos. Por ejemplo:
    • RAG para recuperar contexto dinámico mientras se ajusta el modelo de lenguaje en función de los matices específicos de la tarea. Ejemplo: asistentes legales que acceden a jurisprudencia y la resumen de manera coherente.
  2. Ajuste fino de parámetros eficiente (PEFT): LoRA (adaptación de bajo rango) ayuda en el esfuerzo de minimizar las actualizaciones de parámetros durante el ajuste fino, lo que genera esfuerzos computacionales muy limitados y al mismo tiempo proporciona máxima precisión.
  3. RAG multimodal: Los avances futuros adoptarán una visión combinada de los sistemas RAG combinando texto, imágenes y audio para lograr una interacción enriquecida en diferentes medios.
  4. Aprendizaje por refuerzo en RAG: El aprendizaje por refuerzo puede ayudar a optimizar las estrategias de recuperación al recompensar a los modelos para generar resultados más relevantes y significativos.

[También lea: Revolucionando la IA con modelos de lenguaje multimodales de gran tamaño (MLLM)]

Ejemplos del mundo real de

RAGSintonia FINA
Los asistentes virtuales como Siri y Alexa recuperan información en vivo.Los modelos de análisis de sentimientos están destinados, en última instancia, a monitorear las redes sociales.
Herramientas de atención al cliente que categorizan los tickets utilizando datos históricos y preguntas frecuentes.IA legal capacitada en jurisprudencia basada en jurisdicción.
Las herramientas de investigación recuperan artículos de revistas académicas en tiempo real para brindar información específica.Modelos de traducción que pueden ajustarse a pares de idiomas específicos de la industria.

Conclusión

Tanto RAG como el ajuste fino son técnicas poderosas definidas para resolver diferentes desafíos en la optimización de los LLM. Opte por RAG cuando la atención hacia la evaluación, el escalamiento y la recuperación en tiempo real es primordial, y Por el contrario, el ajuste fino Cuando la precisión, la personalización y la experiencia orientadas a las tareas son imprescindibles.

Social Share