Agentic Data Cloud: del dato al sistema de acción

De dashboards ignorados a sistemas que actúan: la nueva era del dato en la nube

Hay una estadística incómoda que Yasmeen Ahmad, Managing Director de Data Cloud en Google, soltó sin anestesia: entre el 10% y el 20% de los insights generados por plataformas de datos llegan realmente a producción. El resto se queda en un reporte que alguien abrió una vez, en un modelo predictivo que nadie supo cómo integrar al negocio, en una reunión donde todos asintieron y nadie hizo nada. Si tu empresa ha invertido en inteligencia de datos y sientes que el ROI no aparece, probablemente no es problema de los datos — es problema de la acción.

Durante los últimos años, la industria construyó plataformas de datos como sistemas de inteligencia: herramientas que observan, analizan y reportan. Útiles, sí. Pero pasivas. Lo que está ocurriendo ahora en 2026 es un cambio de paradigma hacia los sistemas de acción, donde el dato no solo informa — dispara consecuencias reales en tiempo real. Este es el concepto central detrás del "Agentic Data Cloud" que Google Cloud presentó recientemente, y vale la pena entender qué significa para una empresa mediana en Perú o Latinoamérica.

En este artículo exploramos los tres cambios conceptuales más importantes de esta propuesta, por qué el contexto importa tanto como la calidad del dato, y cómo esto se traduce en decisiones concretas para tu organización.

1. El problema no era la calidad del dato — era el contexto

Durante años, la estrategia de preparación para IA se resumía en tres preguntas: ¿Tenemos datos limpios? ¿Tenemos linaje de datos? ¿Tenemos buena calidad? Razonable. Pero según Ahmad, eso solo te lleva al 50% de precisión cuando un agente de IA intenta operar sobre esos datos.

El 50% restante viene del contexto. Y el contexto es algo que hasta ahora vivía exclusivamente en la cabeza de las personas. El mejor analista de datos no era el que mejor escribía algoritmos — era el que hablaba con el equipo de supply chain, entendía qué significaba realmente ese campo en la columna 7, sabía por qué ese PDF tenía un código especial en la página 10. Ese conocimiento nunca se codificó. Era trabajo invisible.

La respuesta de Google Cloud a esto es el Knowledge Catalog con enriquecimiento semántico impulsado por IA generativa. En lugar de que un humano pase horas documentando descripciones de tablas y glosarios de negocio — trabajo que nadie hace bien porque nadie quiere hacerlo — GenAI infiere ese significado automáticamente. Lo hace sobre datos estructurados y, lo que es más valioso, sobre datos no estructurados como PDFs, contratos y documentos internos que por definición no tienen esquema.

El resultado: un agente puede acceder a ese contexto enriquecido, entender qué datos necesita, y razonar sobre ellos con mucha mayor precisión. No solo es más confiable — también es más barato, porque el agente no necesita cargar miles de documentos en su ventana de contexto.

2. De agentes únicos a enjambres de agentes con intención

Hace dos años, los primeros agentes de datos se construían con una lógica de persona fija: un agente para el científico de datos, otro para el ingeniero de datos, otro para el analista de negocio. Tenía sentido en ese momento — los modelos necesitaban un rol bien definido para funcionar bien.

Eso ya cambió. Los modelos actuales son suficientemente capaces como para ejecutar flujos completos de extremo a extremo: obtener los datos, transformarlos, encontrar el modelo correcto, construir una visualización, incluso desplegar una aplicación. No necesitan ser un solo personaje especializado.

Lo que emerge ahora es lo que Ahmad llama ingeniería orientada a la intención. En lugar de definir qué tareas debe hacer cada agente, defines el objetivo de negocio y provees al sistema de los tools y skills correctos. Google lanzó el Data Agent Kit precisamente para esto: un conjunto de extensiones y capacidades nativas que permiten a los agentes operar sobre BigQuery, optimizar pipelines de Spark, construir visualizaciones, todo dentro del ecosistema de datos de Google Cloud.

El cambio es profundo para los equipos técnicos: el foco deja de estar en las tareas y pasa a estar en los objetivos y resultados. Los practicantes de datos pueden concentrarse en definir qué quiere lograr el negocio — los agentes se encargan del cómo.

3. Multi-nube real: datos donde están, no donde te obligan a moverlos

Toda empresa con la que uno habla hoy es multi-nube, lo haya elegido o no. Tienen un ERP en Azure, una aplicación SaaS corriendo en AWS, y sus datos analíticos en Google Cloud. El problema histórico es que cada plataforma tenía su propio formato propietario, lo que significaba construir pipelines personalizados para cualquier tipo de federación. Pipelines que se rompían, que alguien tenía que mantener, que costaban tiempo y dinero.

La apuesta de Google Cloud es el Cross-Cloud Lakehouse sobre Apache Iceberg como estándar abierto. Iceberg permite que distintas plataformas — BigQuery, Databricks, Snowflake, AWS S3 — lean y escriban en el mismo formato sin conversiones ni pipelines intermedios. El dato vive donde tiene que vivir, y el sistema lo alcanza desde donde sea.

Esto no es solo una ventaja técnica. Es una decisión estratégica que elimina el vendor lock-in y permite que los agentes de IA accedan a datos dispersos en múltiples nubes como si fueran una sola fuente coherente.

¿Cómo aplica esto en tu empresa?

Si gestionas una empresa mediana en Perú o Latinoamérica, probablemente no tienes un equipo de 50 ingenieros de datos. Pero los principios aquí son completamente aplicables a tu escala. Estas son las preguntas concretas que deberías hacerte hoy:

  • ¿Tus datos tienen contexto documentado? No solo columnas con nombres técnicos — sino descripciones que un sistema externo pueda entender. Si no, herramientas como el Knowledge Catalog de Google o incluso un proceso asistido por IA pueden generar ese enriquecimiento semántico sobre tus tablas existentes.
  • ¿Tus insights llegan a acción? Si tienes reportes que nadie actúa, el problema no es el reporte — es que no hay un flujo automatizado que convierta la señal en una tarea, una alerta, una actualización en tu sistema operacional.
  • ¿Estás bloqueado en un solo proveedor de datos? Si tu información está fragmentada entre plataformas, evalúa si Apache Iceberg puede ser el puente que elimine esa fragmentación sin migraciones costosas.
  • ¿Tus agentes de IA tienen acceso a datos en tiempo real? Un agente que trabaja con datos de ayer no puede tomar decisiones de hoy. La latencia del dato es tan importante como su calidad.

El salto de inteligencia a acción no requiere reemplazar toda tu infraestructura. Requiere rediseñar cómo el dato fluye desde donde vive hasta donde se necesita tomar una decisión — y asegurarte de que ese flujo sea automático, contextualizado y auditable.

Conclusión

La narrativa de "tener datos limpios es suficiente" quedó atrás. En 2026, la ventaja competitiva está en las empresas que logran que sus datos no solo informen — sino que activen. Que un patrón en la data de despacho ajuste automáticamente una ruta. Que una caída en ventas dispare una campaña. Que un agente combine información interna con señales externas y proponga una estrategia en minutos, no en semanas.

Google Cloud está construyendo la infraestructura para ese mundo. Pero la infraestructura sola no hace nada — necesita una estrategia de datos que incluya contexto, arquitectura multi-nube inteligente y procesos rediseñados alrededor de la acción, no del reporte.

En Consultoría-Ti ayudamos a empresas en Perú y Latinoamérica a dar exactamente ese salto: desde tener datos hasta tener sistemas que actúan sobre ellos. Si quieres evaluar dónde está tu empresa en esta transición y qué pasos concretos puedes dar, conversemos.

Fuentes y Referencias

Google Cloud Tech — From systems of intelligence to systems of action: Yasmeen Ahmad on the agentic data cloud



✨ Contenido generado con ContentFlow — Consultoría-Ti

Compartir
Etiquetas
Google Bigtable: base de datos NoSQL para escalar