cerebroLY
Login Empezar gratis

Cómo funciona el plugin de IA para WordPress

Sistema RAG para recuperación semántica en tiempo real combinado con fine-tuning para un modelo entrenado con tus datos. Puedes activar ambos a la vez — esa es la configuración más potente.

Plugin WP RAG y ajuste fino
Dos motores de inteligencia artificial

Cerebroly implementa dos estrategias técnicas que puedes activar de forma independiente o combinar simultáneamente. La combinación de ambas es la configuración óptima: el sistema RAG recupera información precisa y siempre actualizada de tu base de conocimientos, y el modelo fine-tuned aporta el tono, la terminología y la estructura de respuesta propia de tu negocio.

RAG · Retrieval-Augmented Generation Fine-Tuning · Modelo personalizado

Desde el panel de administración puedes activar uno, el otro, o los dos a la vez. Con RAG activo, cada consulta dispara una búsqueda semántica en tu base de datos vectorial antes de que el modelo responda. Con Fine-Tuning activo, la IA usa un modelo de OpenAI entrenado específicamente con el contenido de tu sitio. Activar los dos juntos no genera conflicto: el RAG aporta contexto en tiempo real y el modelo fine-tuned lo comunica con la voz de tu marca.

Configuración recomendada: RAG + Fine-Tuning activos a la vez

RAG es ideal cuando tu contenido cambia con frecuencia: nuevos artículos, precios actualizados, fichas de producto. El Fine-Tuning es el que le enseña al modelo tu tono, tu terminología y cómo estructurar las respuestas. Juntos dan lo mejor de los dos mundos: información siempre actualizada comunicada con la personalidad de tu marca.

Sistema RAG wordpress
Respuestas fundamentadas en tu contenido real

RAG (Retrieval-Augmented Generation) resuelve el problema de las alucinaciones de raíz. En lugar de dejar que el modelo "recuerde" información de su entrenamiento general, el sistema consulta tu base de conocimientos real antes de generar cualquier respuesta. Funciona en cuatro fases que ocurren en milisegundos cada vez que alguien escribe en el chat:

1
Indexar

Tu contenido publicado (posts, páginas, productos, archivos subidos) se fragmenta y se convierte en vectores numéricos que se almacenan en la tabla wp_cerebroly_embeddings de tu propia base de datos de WordPress.

2
Recuperar

Cuando el usuario hace una pregunta, esa pregunta también se convierte en un vector. El plugin busca los fragmentos de tu base de datos con mayor similitud semántica con la consulta y selecciona los más relevantes.

3
Enriquecer

Los fragmentos recuperados se inyectan en el contexto que se envía al modelo de OpenAI. El system prompt le indica explícitamente: responde solo con la información de este contexto; si no la tienes, dilo claramente.

4
Generar

El modelo produce una respuesta fundamentada exclusivamente en los fragmentos recuperados de tu contenido. Sin inventar, sin mezclar con datos genéricos de internet.

Si actualizas un artículo o subes un nuevo documento, el sistema regenera los embeddings de ese contenido automáticamente en segundo plano. No necesitas reindexar todo ni reiniciar nada.

Fuentes de datos que wordpress puede indexar

Desde la configuración de RAG puedes activar o desactivar exactamente qué tipos de contenido se indexan. El plugin trabaja con tres fuentes:

01
Posts y páginas de WordPress

Todos los posts y páginas en estado publicado se incluyen por defecto. Puedes desactivar individualmente posts, páginas o custom post types desde la configuración de RAG.

02
Productos de WooCommerce

Si tienes WooCommerce activo, puedes indexar los productos de tu tienda. El sistema extrae nombre, descripción, precio, categorías y especificaciones técnicas de cada producto.

03
Archivos subidos manualmente

Desde el panel de archivos del plugin puedes subir PDFs, manuales, documentación interna o cualquier archivo de texto. El contenido se extrae, fragmenta e indexa igual que el contenido de WordPress. Los archivos se guardan en la tabla wp_cerebroly_files.

Procesamiento del contenido

Antes de generar embeddings, el contenido pasa por una limpieza que elimina etiquetas HTML, espacios múltiples y saltos de línea innecesarios. El texto limpio se divide en chunks de hasta 1.000 caracteres con un solapamiento de 200 caracteres entre fragmentos consecutivos, preservando el contexto en los bordes de cada trozo.

Búsqueda vectorial
Encuentra significados, no solo palabras

Cada fragmento pasa por el modelo de embeddings de OpenAI (por defecto text-embedding-ada-002) que lo convierte en un vector numérico de alta dimensión. Textos con significado parecido producen vectores cercanos aunque usen palabras completamente distintas.

Por qué importa esto en la práctica

Tu página de envíos dice "plazo de entrega para pedidos internacionales". Un usuario pregunta "¿cuánto tarda en llegar si estoy en México?". Las palabras son distintas pero el significado es el mismo. La búsqueda por palabras clave tradicional fallaría; la búsqueda semántica por embeddings las conecta correctamente.

  • Entiende sinónimos, reformulaciones y jerga coloquial
  • Funciona igual en español, inglés y otros idiomas
  • Resiste preguntas mal escritas o con errores tipográficos
  • Encuentra información técnica relevante aunque esté redactada de forma formal

Método de similitud configurable

El plugin calcula la cercanía entre el vector de la pregunta y los vectores almacenados usando tres métodos a tu elección:

  • Similitud coseno (recomendado): mide el ángulo entre vectores, insensible a la longitud del fragmento.
  • Producto escalar: más rápido, útil cuando los vectores ya están normalizados.
  • Distancia euclídea: calculada como inverso de la distancia, compatible con búsquedas de proximidad clásicas.

También puedes ajustar el umbral mínimo de similitud (0,75 por defecto) y el número de fragmentos recuperados por consulta (top-k, 5 por defecto). Cuanto mayor el umbral, más estricta la coincidencia; cuanto mayor el top-k, más contexto recibe el modelo.

Almacenamiento local · IA autohospedada

Todos los vectores se guardan en la tabla wp_cerebroly_embeddings de tu propia base de datos de WordPress. No usamos servicios externos de vectores como Pinecone o Weaviate. Tus embeddings nunca salen de tu infraestructura.

Flujo completo de una consulta RAG en wordpress cerebroly

Esto es exactamente lo que ocurre cada vez que un visitante escribe algo en el chat:

1
Pregunta del usuario

"¿Tenéis el modelo X en color azul y cuánto tarda en llegar?"

2
Reescritura de la consulta (opcional)

Si tienes activado el query rewriting, el plugin pide a la IA que reformule la pregunta antes de buscar, mejorando la precisión de la recuperación cuando la pregunta original es vaga o coloquial.

3
Búsqueda semántica en wp_cerebroly_embeddings

La pregunta se vectoriza y se compara contra todos los fragmentos almacenados. Se seleccionan los top-k fragmentos que superan el umbral de similitud configurado.

4
Construcción del prompt

Se arma el prompt con: el system prompt personalizable, los fragmentos recuperados como contexto verificado, el historial reciente de la conversación y la pregunta del usuario.

5
Respuesta del modelo

El modelo configurable (gpt-3.5-turbo, gpt-4o, etc.) genera una respuesta usando exclusivamente el contexto inyectado. Si la información no está en los fragmentos recuperados, el asistente lo indica claramente en lugar de inventar.

System prompt personalizable

Desde la configuración de RAG puedes editar libremente el system prompt. El valor por defecto es: "Eres un asistente especializado del sitio web. Responde las consultas basándote únicamente en la información del contexto siguiente. Si la información no está en el contexto, indícalo honestamente."

Fine-Tuning
Un modelo entrenado con el ADN de wordpress

El fine-tuning crea un modelo de OpenAI derivado del modelo base que elijas (por defecto gpt-3.5-turbo), ajustado específicamente con pares pregunta-respuesta generados a partir del contenido de tu sitio. El resultado es un GPT personalizado que responde con tu tono, tu estructura y tu terminología.

Qué aporta el fine-tuning que el RAG solo no da

Mientras el RAG busca en tus datos en tiempo real, el fine-tuning incorpora ese conocimiento al propio modelo. Puedes tener ambos activos a la vez sin ningún conflicto: el RAG aporta los fragmentos correctos y el modelo fine-tuned los comunica con la voz de tu marca.

  • El modelo aprende a estructurar respuestas según tu estilo editorial
  • Asimila terminología técnica o de sector sin necesitar que aparezca en cada chunk
  • Genera un identificador único con el sufijo wp-chat-[hash] para distinguir tu modelo del modelo base
  • El estado del entrenamiento (pendiente, en proceso, completado) se registra en la tabla wp_cerebroly_models de tu base de datos

Proceso técnico de entrenamiento

1
Extracción de contenido

El plugin extrae posts, páginas y archivos publicados y los formatea en pares pregunta-respuesta en formato JSONL, el formato que requiere la API de fine-tuning de OpenAI.

2
Edición opcional del dataset

Antes de entrenar puedes revisar y editar cada par en el editor integrado con validación de esquema JSON en tiempo real. El botón "Mejorar con IA" genera variaciones automáticamente para enriquecer el dataset.

3
Subida del archivo JSONL a OpenAI

El archivo se sube a la API de OpenAI como training_data.jsonl con propósito fine-tune. Se requiere un mínimo de 3 ejemplos para iniciar el proceso.

4
Job de fine-tuning en OpenAI

El plugin lanza el job en /fine_tuning/jobs. El proceso puede tardar desde minutos hasta horas dependiendo del volumen de datos. El estado se actualiza automáticamente vía webhook.

5
Modelo activo

Una vez completado, el modelo se marca como activo y el chat empieza a usarlo automáticamente. Puedes ver el historial de todos tus modelos entrenados con fecha, estado y fuentes.

Modelo base configurable

Puedes elegir el modelo base sobre el que se realiza el fine-tuning desde la configuración del plugin. Por defecto es gpt-3.5-turbo, pero puedes cambiarlo a versiones más avanzadas según tus necesidades y presupuesto de API.

Editor de datos de entrenamiento

El plugin incluye un editor de código con Monaco Editor (el mismo motor que usa VS Code) donde puedes revisar y editar manualmente los pares de entrenamiento en formato JSON antes de lanzar el proceso.

Estructura de cada ejemplo

Cada entrada sigue el formato de mensajes de OpenAI: un mensaje del rol user con la pregunta y un mensaje del rol assistant con la respuesta ideal. El editor valida el esquema en tiempo real y avisa si alguna entrada tiene la estructura incorrecta.

  • Añadir nuevos pares manualmente desde la interfaz
  • Formatear el JSON con un clic
  • Regenerar el dataset original desde el contenido publicado
  • Enriquecer con IA para generar variaciones automáticamente
  • Previsualizar los datos antes de enviarlos a OpenAI

Por qué editar el dataset marca la diferencia

El contenido que publicas en tu web está pensado para lectores humanos, no para entrenar modelos. Editar el dataset te permite añadir variaciones de preguntas, corregir respuestas, ajustar el tono exacto que quieres que use el asistente y establecer límites claros sobre qué puede y qué no puede decir. Cuanto mejor el dataset, mejor el modelo.

Integra el chatbot de WordPress
en cualquier plataforma

Una vez configurado, tu asistente de IA puede aparecer en múltiples plataformas usando tu WordPress como backend centralizado. Tienes tres métodos de integración:

1. Shortcode nativo en WordPress

Usa [cerebroly_chat] en cualquier página, post o widget de WordPress.

2. JavaScript snippet para sitios externos

Desde Ajustes del plugin puedes copiar un snippet de JavaScript que carga el chat como un iframe flotante en cualquier web externa. El snippet apunta a tu WordPress como backend centralizado. Compatible con React, Vue, Next.js, Shopify, Squarespace o cualquier stack que permita añadir código JavaScript personalizado.

3. iFrame directo

El endpoint /wp-json/cerebroly/v1/chat-iframe devuelve una página HTML completa con el chat listo para funcionar dentro de un <iframe>. Útil para aplicaciones móviles via WebView o plataformas que no permiten scripts externos.

Control de acceso por dominio (CORS)

Para evitar uso no autorizado, el plugin implementa una lista de dominios autorizados. Solo los dominios que añadas explícitamente en la configuración pueden hacer llamadas a la API del chat. Si un origen no está en la lista, la solicitud se rechaza y se registra en el log del sistema.

Privacidad y soberanía de datos

Cerebroly no usa servidores propios intermedios. Toda la infraestructura de datos reside en tu WordPress. Es IA autohospedada en su sentido real: tú controlas dónde están los datos y quién puede acceder a ellos.

Qué queda en tu servidor

  • Los embeddings vectoriales (wp_cerebroly_embeddings)
  • Los archivos subidos (wp_cerebroly_files)
  • El historial de modelos y jobs de fine-tuning (wp_cerebroly_models)
  • Los datos de entrenamiento JSONL antes de subirlos a OpenAI
  • La configuración completa del plugin (system prompts, umbrales, modelos, dominios autorizados)

Qué se envía a OpenAI

En el modo RAG, cada llamada incluye: la pregunta del usuario, los fragmentos de contenido recuperados y el system prompt. En el modo Fine-Tuning, se sube además el archivo JSONL de entrenamiento. Según la política actual de OpenAI para clientes de API, estos datos no se usan para entrenar sus modelos públicos.

Aviso importante

No incluyas en el contenido indexado información confidencial como contraseñas, claves privadas, datos personales de terceros o documentos bajo NDA. Todo lo que indexas puede ser enviado a OpenAI como parte del contexto de una consulta y puede quedar expuesto a través del chat público de tu web.

¿Listo para añadir IA real a tu WordPress?

Plugin de wordpres con RAG + Fine-Tuning. Tus datos en tu servidor.
Solo pagas directamente la API de OpenAI.

Descargar Cerebroly