Guia 07: Ajuste Fino y Adaptación de Modelos

Subtítulo: El Manual del “Especialista de Motores”

Introducción: Diferenciando “Saber” de “Ser”

Existe una confusión costosa en la industria: creer que para que una IA sepa sobre tu empresa, debes re-entrenarla. Eso es falso. Para el conocimiento, usamos RAG.

Pero, ¿qué pasa cuando quieres cambiar el comportamiento? ¿Qué pasa cuando necesitas que la IA no solo cite la ley, sino que piense como un abogado agresivo o escriba con el tono exacto de tu marca?

RAG es darle libros a un estudiante. Ajuste Fino (Fine-Tuning) es enviarlo a la universidad durante cuatro años. Esta guía es el manual para cuando la instrucción no basta y necesitas modificar la estructura misma del “cerebro” para especializar la habilidad.

Tu rol aquí es el de “Especialista de Motores”. No estás usando el motor, lo estás modificando.


El Dilema Central: ¿Cuándo Usar RAG vs. Cuándo Usar “Fine-Tuning”?

Este es el trade-off más importante de la arquitectura de IA. Usar la herramienta incorrecta es caro e ineficiente.

Característica RAG (Gestión de Contexto) Ajuste Fino (Adaptación de Modelo)
Objetivo Principal Insertar Conocimiento (Hechos, Datos) Modificar Habilidad (Estilo, Tono, Formato)
Metáfora El “Bibliotecario” (Agente + Libros) El “Especialista” (Agente que fue a la Universidad)
¿Cómo Funciona? Añade datos al Contexto (la “pizarra”) en tiempo real. Modifica los Pesos (el “cerebro”) del modelo antes de usarlo.
Cuándo Usarlo 1. Cuando los datos cambian constantemente (noticias, reportes). 2. Cuando necesitas citar fuentes exactas (legal, médico). 3. Cuando los datos son hechos (ej. “Normativa Interna”). 1. Cuando quieres que la IA suene como tú (Voz de Marca). 2. Cuando quieres que razone de una forma específica (ej. “como un abogado”). 3. Cuando quieres que formatee la salida siempre igual (ej. un JSON complejo).
Ejemplo “Usa este PDF (RAG) para decirme qué es el BCP.” “Te he entrenado (Ajuste Fino) con 500 emails míos. Ahora, escribe como yo.”

La Regla de Oro: Si quieres que la IA sepa algo, usa RAG. Si quieres que sea algo, usa Ajuste Fino.


Parte 1: Caso de Uso N°1 (Habilidad) - “La Voz de la Marca”


Parte 2: Caso de Uso N°2 (Formato) - “El Experto en JSON”


Parte 3: Caso de Uso N°3 (Razonamiento) - “El Abogado”


Parte 4: El “Stack” Técnico (Cómo se hace sin 500 GPUs)

En el pasado, hacer “ajuste fino” requería un centro de datos. Hoy, gracias a los modelos Open-Source y nuevas técnicas, un “Ingeniero de Prototipos” (Guía 08) puede hacerlo en una sola laptop o un servidor en la nube.

La clave es no re-entrenar el modelo entero. Solo “afinas” una pequeña fracción de él.

  1. El Modelo Base: Eliges un modelo Open-Source (ej. Llama 3 8B).
  2. La Técnica (LoRA / QLoRA):
    • LoRA (Low-Rank Adaptation): Es la técnica clave. En lugar de modificar los 8 mil millones de “perillas” (parámetros) del modelo, “congelas” el modelo original e insertas una “capa de afinación” diminuta (quizás solo el 1% del tamaño total) al lado.
    • El Entrenamiento: Entrenas solo esa pequeña capa con tus 1.000 emails de “Voz de Marca”.
    • QLoRA: Una versión más eficiente de LoRA que te permite hacer esto con aún menos memoria.
  3. El Resultado (El “Adaptador”): Al final, tienes dos archivos:
    1. El Modelo Base (Llama 3 8B - 16GB) Intacto.
    2. Tu “Adaptador LoRA” (Tu “Voz de Marca” - 200MB) - Tu Propiedad Intelectual.

Cuando ejecutas tu agente, “cargas” el modelo base y “encima” le pones tu “adaptador”.


Conclusión: El Verdadero Rol del “Especialista de Motores”

RAG y el Ajuste Fino no son competidores; son un equipo.

El “Ingeniero de Prototipos” (Guía 08) usa esta “Guía de Especialización” para construir una “fábrica” industrializada (Guía 11) verdaderamente optimizada.

Un agente que tiene acceso a los libros correctos (RAG) y que además se graduó en la especialidad correcta (Ajuste Fino) es el trabajador autónomo definitivo.


« Guía 06
Volver al Índice
Guía 08 »