8 min remaining
0%
What Mercury Do

El Pipeline Autónomo: Migrando y Armando 300,000 Artículos para la Era de la IA

Explora el enfoque innovador que adoptamos para migrar y optimizar 300,000 artículos para motores de búsqueda de IA, asegurando cero tiempo de inactividad y una visibilidad mejorada.

8 min read
Progress tracked
8 min de lectura
AI Generated Cover for: The Autonomous Pipeline: Migrating and Weaponizing 300,000 Articles for the AI Era

AI Generated Cover for: The Autonomous Pipeline: Migrating and Weaponizing 300,000 Articles for the AI Era

Resumen:Esta es la primera edición de mi desglose arquitectónico en bruto. Sin pulido, sin teatro de "liderazgo de pensamiento". Solo lo que realmente estamos construyendo en Mercurio: los sistemas, la pila, las cosas que fallaron y las brutales realidades de la ingeniería en 2026. Paso mi vida en la intersección de producto, IA e infraestructura. Aquí es donde pienso en voz alta. Hoy, estamos viendo cómo no solo migramos 300,000 artículos heredados, sino que construimos un sistema autónomo que los reescribió y los armó para motores de búsqueda de IA mientras se movían.

La Noche que Vi Migrar 300,000 Artículos por Sí Mismos

Son las 3:47 AM de un martes en Hong Kong. Estoy mirando la pantalla de un portátil que muestra un panel de control de CLI tail que se actualiza en tiempo real—entradas apareciendo más rápido de lo que puedo leerlas—y estoy tratando de recordar la última vez que sentí esta combinación de terror y alivio.

Hace tres semanas, un cliente de Japón se acercó a nosotros con lo que parecía una migración estándar de CMS (de WordPress a nuestro headless personalizado). Ellos manejan dieciséis verticales industriales diferentes—salud, energía, aeroespacial, lo que sea—alojados en WordPress desde 2017. 300,000 artículos. Millones de palabras. Una década de conocimiento institucional atrapado en una plataforma que se había convertido en una prisión.

¿El truco? Publican 20 nuevos artículos por día.Cero tolerancia al tiempo de inactividad.Si lleváramos el sitio a la oscuridad incluso por una hora, romperíamos su ventaja/ flujo de ingresos. Si perdiéramos un solo redireccionamiento, destruiríamos una década de equidad SEO.

Les dije que nos encargaríamos de ello. Luego me senté en mi apartamento y miré al techo durante una hora, preguntándome si acababa de mentir.

Por qué no escribimos un script

Aquí está la cosa sobre las migraciones tradicionales: escribes un script en Python, lo ejecutas, se rompe en el artículo 7,432 porque la publicación de blog de alguien de 2019 contiene un emoji que destruye tu analizador UTF-8, y luego estás depurando a las 4 AM mientras el cliente entra en pánico. Es mecánico, frágil y profundamente estúpido.

No quería un script. Quería un equipo que no durmiera.

Así que no construimos una herramienta de migración. Construimos una fuerza laboral: once agentes autónomos funcionando con IA, cada uno con una descripción de trabajo específica, cada uno siguiendo el mismo ritmo: Orientar → Reportar → Actuar → Registrar.No esperan a que les diga qué hacer. Se despiertan, leen el estado actual de la base de datos y toman decisiones.

Déjame presentarte a las personas que realmente hicieron este trabajo:

El Arqueólogo (WP Migrator)

Este agente está obsesionado con la continuidad. Cada mañana a las 6 AM, hora de Tokio, lee el registro de sincronización de la ejecución anterior, luego consulta todas las dieciséis colecciones de Payload para encontrar huecos. No solo mueve contenido; realiza cirugía. Elimina la década de residuos de shortcode de WordPress, corrige los enlaces internos que apuntaban a subdominios muertos y genera nuevos extractos que realmente tienen sentido (porque la mitad de los antiguos eran solo los primeros 160 caracteres del artículo, incluyendo "Haz clic para leer más...").

Funciona en paralelo. Mientras migra el sector de la salud, ya está auditando el sector de la energía en busca de enlaces internos rotos. Cuando se encuentra con un caso límite—digamos, una publicación con diecisiete tweets incrustados de una cuenta eliminada—no se bloquea. Lo marca, lo envía a una cola de revisión humana en Notion y sigue avanzando.

El Fantasista (Content Optimizer)

Aquí es donde el proyecto dejó de ser una migración y se convirtió en una actualización.

El cliente no solo necesitaba que sus artículos se trasladaran; necesitaban que estuvieran listos para 2026. El cliente B2B que leía su contenido ya no comienza con Google; comienza con Perplexity, con Claude, con Gemini. Hacen preguntas y esperan respuestas únicas. Si tu contenido no está estructurado para ser citado por una IA, no existes.

Así que mientras el Arqueólogo movía los muebles, el Fantasista estaba remodelando la casa. Reescribió los titulares para que fueran declarativos en lugar de ingeniosos ("Tres formas de ahorrar en el tipo de cambio" se convirtió en "La implementación de cobertura del tipo de cambio reduce el desperdicio en un 17%: Estudio de caso"). Descompuso párrafos densos en unidades escaneables y ricas en datos que los sistemas RAG pueden digerir fácilmente. Agregó preguntas frecuentes estructuradas al final de piezas de formato largo específicamente para dirigirse a los motores de respuesta de IA.

Cada artículo que pasó por este agente salió más valioso de lo que entró. No solo estábamos preservando la historia; la estábamos armando para la era GEO.

El Perfeccionista (Agente SEO)

¿Sabes quién se preocupa por los datos estructurados JSON-LD a las 2 AM? Este agente. Escanea cada colección en busca de metadatos faltantes, impone límites de caracteres rigurosos (60 para títulos, 155 para descripciones) y genera mapas del sitio al instante. Cuando detecta un cambio de slug en Payload, calcula inmediatamente la matriz de redirección y actualiza las reglas de .htaccess antes de que el cambio entre en vigor.

Detectó algo que los ojos humanos habrían pasado por alto: una página de archivo de categoría de 2022 que tenía 4,000 enlaces de retroceso apuntando a ella. Si hubiéramos pasado por alto esa redirección, el tráfico orgánico del cliente habría caído un 12% de la noche a la mañana. El Perfeccionista lo marcó, lo mapeó y lo solucionó mientras yo cenaba.

El Paranoico (Seguridad y Cumplimiento)

Este se ejecuta antes de cada despliegue. Verifica los comodines CORS que permitirían a cualquiera raspar la nueva API. Busca secretos codificados que podrían haberse filtrado en un archivo de configuración. Realiza auditorías de accesibilidad WCAG 2.1 AA en cada artículo, verificando el texto alternativo y las proporciones de contraste de color, porque el equipo legal del cliente estaba aterrorizado por una demanda de la ADA.

Tres días antes del lanzamiento, marcó cinco artículos que contenían fotos de stock no licenciadas de 2017. No solo los marcó, sino que generó consultas de imágenes de reemplazo, verificó duplicados y preparó los scripts de intercambio. Nos salvó de un dolor de cabeza por infracción de derechos de autor de $50,000.

Dejé de asistir a las reuniones de pie. Solo leí el registro.

La Mente Colmena

Aquí está el detalle que hizo que esto realmente funcionara: la integración de Obsidian MD.

Lo usamos como un córtex compartido. Cada agente escribe en el mismo espacio de trabajo. Hay un Tablero de Tareas y un Grafo de Conocimiento que se actualiza a medida que los agentes completan su trabajo. Hay una página de Arquitectura que evoluciona a medida que el sistema cambia. Hay un Registro de Auditoría que registra cada decisión: por qué un artículo particular fue marcado para revisión manual, por qué se creó una regla de redirección, por qué falló una verificación de seguridad.

Cuando un nuevo desarrollador se unió al proyecto en el día tres, no tuve que informarle. Solo le di acceso a Obsidian. Leíó los registros de migración como una novela y supo exactamente en qué punto estábamos.

El sistema tiene memoria. Los equipos humanos olvidan. Los agentes no.

El momento en que me di cuenta de que esto era diferente (soy inútil)

Alrededor del día cuatro, algo cambió. Estaba revisando el resumen diario—dándome cuenta de que el Agente de Cumplimiento había marcado cinco elementos específicos, que el Escritor Fantasma había optimizado 400 artículos ese día, que el Gerente de Redirección había detectado un patrón de URL que habíamos pasado por alto—y me di cuenta de que ya no estaba gestionando un proyecto. Estaba monitoreando un ecosistema.

La pregunta dejó de ser "¿Estamos en camino para el lanzamiento?" y se convirtió en "¿Qué aprendió el sistema hoy?"

Esta es la parte que es difícil de explicar a las personas que no lo han sentido. Sí, los agentes nos ahorraron tiempo. Migramos 300,000 artículos en aproximadamente 20 horas humanas distribuidas en cinco días. Una agencia tradicional habría asignado a veinte personas a esto durante seis meses.

Pero la verdadera mejora no fue la velocidad. Fue la calidad de la decisión.Cuando cada rincón de tu base de código tiene una inteligencia autónoma revisándolo, registrando sus hallazgos y sacando a la luz anomalías, dejas de operar por corazonadas. Operas con la verdad fundamental. Los agentes no se cansan. No asumen que arreglaron ese error ayer. Verifican, cada vez.

The Stack (Para los Ingenieros que se Importan)

  • Claude Code / Kimi Code / Open Code API: No es para chat, sino para cognición estructurada. Construimos tuberías, no conversaciones. Cada agente produce JSON que el siguiente agente puede analizar.
  • Payload CMS 3.x: Sin cabeza, nativo de TypeScript y construido para arquitecturas multi-tenant. Maneja los dieciséis verticales como si fueran dieciséis publicaciones separadas, que esencialmente lo son.
  • Vercel: Nuestro host backend.
  • Obsidian: Espacio de trabajo MD nativo. El sistema escribe su propia documentación porque los humanos no deberían tener que hacerlo.

99.2% Tasa de Éxito

No capturamos todo. El 0.8% de los artículos requirió intervención humana. Integraciones antiguas de Flash que los agentes no pudieron reconciliar. Calculadoras personalizadas en JavaScript de 2018 que necesitaban reconstrucción manual. Una sola publicación que fue escrita completamente en Wingdings (no quiero saber por qué).

Pero el sistema marcó cada uno de ellos. Nada se escapó. Nada se volvió oscuro. Los equipos editoriales continuaron publicando durante toda la migración, sin saber que su contenido estaba siendo trasladado a un nuevo universo en segundo plano.

Qué viene después

El nuevo sitio del cliente está en vivo. Los agentes siguen funcionando—ahora en modo de mantenimiento, revisando errores 404, optimizando nuevos artículos a medida que se publican, manteniendo el sistema saludable.

Pero ya estoy pensando en lo que construiremos a continuación.

Esta es la nueva forma de trabajo. No humanos gestionando herramientas, sino humanos dirigiendo equipos autónomos que nunca duermen, nunca olvidan y nunca dejan de optimizar. Es aterrador. Es agotador. Y no creo que lo haría de otra manera ahora.

— James, Mercury Technology Solutions, marzo de 2026