Agentes de IA seguros: el error que filtra tus datos

El error arquitectónico que convierte tu agente de IA en una fuga de datos

La mayoría de empresas que implementan agentes de IA internos tienen el mismo problema: el sistema funciona perfectamente en demo, los usuarios lo adoptan con entusiasmo, y nadie se da cuenta de que cada consulta está enviando información confidencial fuera de la red corporativa. No es un bug. Es la arquitectura estándar.

Un análisis publicado en Dev.to por Mohamed, arquitecto de sistemas con tres años consultando para empresas enterprise en San Francisco, describe con precisión quirúrgica por qué el enfoque más común para construir agentes RAG (Retrieval-Augmented Generation) es un desastre de seguridad esperando materializarse. Y lo más preocupante: la mayoría de equipos de ingeniería no lo detectan hasta después del incidente.

En este artículo vamos a desglosar exactamente qué pasa con tus datos cuando tu agente de IA responde una pregunta, por qué los acuerdos empresariales con proveedores no resuelven el problema de fondo, y qué arquitectura sí protege tu información sensible.

El flujo real de datos en una arquitectura RAG estándar

Imagina que un empleado le pregunta al agente interno: "¿Cuáles son los diferenciadores que estamos presentando a las cuentas del tercer trimestre?" Parece una consulta inofensiva. Lo que pasa por debajo es esto:

El sistema hace una búsqueda semántica en tu base vectorial y recupera los fragmentos más relevantes de tus documentos internos — tu estrategia de ventas, tu modelo de precios, tu análisis competitivo, las notas de tu CRM. Luego arma un prompt que combina la pregunta original con todo ese contexto propietario. Y ese payload completo se envía por HTTPS a la API de inferencia de un proveedor externo: OpenAI, Anthropic, Cohere.

Tu inteligencia empresarial más sensible acaba de cruzar el perímetro de seguridad que controlas. Cada vez. Con cada consulta.

El stack tecnológico que describe el análisis es exactamente el que más se usa hoy: LangChain o LlamaIndex para orquestación, Pinecone o Weaviate como base vectorial, y una API externa como motor de inferencia. Funciona. El problema es que fue diseñado para conveniencia, no para seguridad de datos enterprise.

Por qué el "acuerdo empresarial" no es suficiente

Cuando se plantea este problema, la respuesta más común es: "Tenemos un acuerdo enterprise con el proveedor. Garantizan que no entrenan con nuestros datos." El análisis desmonta este argumento con cuatro puntos que vale la pena entender bien.

Primero, que el proveedor no entrene con tus datos no significa que esos datos no crucen infraestructura que tú no controlas — sus balanceadores de carga, sus pipelines de logging, sus capas de caché. TLS en tránsito es el mínimo exigible, no una arquitectura de seguridad.

Segundo, los marcos de cumplimiento no tienen excepciones para acuerdos de proveedor. SOC 2 Type II, ISO 27001, HIPAA, GDPR — ninguno contempla una cláusula de "pero tenemos un contrato". Que tus datos salgan de tu perímetro es un evento de cumplimiento, punto.

Tercero, la propiedad intelectual es una categoría diferente. Roadmaps de producto sin lanzar, modelos de precios propietarios, materiales de due diligence de M&A — una vez que esa información sale, no hay SLA que la devuelva. Y en 2023, OpenAI divulgó un bug que expuso historial de conversaciones de algunos usuarios. Los proveedores tienen incidentes. Cuando tus datos viven en su pipeline, sus incidentes son tus incidentes.

Cuarto, hay superficies de ataque que casi ningún equipo modela: prompt injection vía documentos recuperados (si alguien puede insertar contenido malicioso en tu base vectorial, puede manipular el comportamiento del agente), y el endpoint de inferencia como vector de exfiltración (si tu servidor de orquestación es comprometido, cada prompt compilado es un paquete limpio y estructurado de tu información más relevante, listo para extraer).

Cómo aplica esto en empresas de Perú y Latinoamérica

En Perú y la región, el patrón que describe este análisis es exactamente el que más vemos en proyectos de transformación digital. Empresas de todos los tamaños están conectando sus bases de conocimiento internas — contratos, políticas, catálogos de productos, datos de clientes — a agentes conversacionales usando APIs de LLMs externos. La velocidad de implementación es atractiva. El costo de entrada es bajo. Y nadie está modelando el riesgo de datos.

Para empresas en sectores como banca, seguros, salud o legal, esto no es solo un riesgo técnico — es un riesgo regulatorio real. La SBS, la SUNAFIL y los marcos de protección de datos personales en la región tienen requisitos sobre dónde y cómo se procesa información sensible. Un agente de IA que manda datos de clientes a una API externa puede ser un problema de cumplimiento antes de ser un problema de seguridad.

Pero incluso fuera de sectores regulados, el riesgo de propiedad intelectual es concreto. Si tu ventaja competitiva está en tu estrategia comercial, tus precios, tu conocimiento del mercado local — esa información no debería salir de tu infraestructura cada vez que un empleado hace una pregunta.

¿Cómo aplica esto en tu empresa?

El análisis propone una arquitectura clara: el agente y los datos que procesa deben vivir dentro del mismo perímetro de seguridad. Todos los componentes en infraestructura que tú controlas, sin llamadas externas para operaciones con datos sensibles.

Para equipos con capacidad técnica robusta, el stack de referencia es un LLM self-hosted (Llama 3 70B o variantes cuantizadas de Mistral en GPU propia), una base vectorial privada (Weaviate o Qdrant en cluster interno), y orquestación con LangChain o LlamaIndex. El costo real: entre 3 y 5 ingenieros senior, 8 a 14 semanas para un despliegue production-ready, más mantenimiento de infraestructura MLOps. Los benchmarks de un despliegue reciente citado en el análisis muestran latencia P50 de ~380ms y P99 de ~1.1s en cluster A100 — perfectamente usable para casos de uso enterprise.

Para organizaciones donde el ancho de banda de ingeniería es la restricción real, existe un punto medio: plataformas unificadas que despliegan todo el stack en tu propia infraestructura, sin depender de APIs externas para inferencia. La pregunta que debes hacer siempre antes de elegir cualquier solución: ¿el endpoint de inferencia se queda dentro de mi red? Si la respuesta no es un sí claro e inequívoco, la arquitectura tiene el problema descrito.

Si ya tienes un agente de IA en producción, el primer paso es simple: revisar el flujo de datos y mapear exactamente qué información sale de tu red con cada consulta. Muchas veces, ese ejercicio es suficiente para justificar el rediseño.

Conclusión

La arquitectura RAG estándar no es insegura por descuido — es insegura porque fue optimizada para velocidad de implementación, no para protección de datos enterprise. El problema no está en los LLMs ni en las bases vectoriales. Está en dónde viven y hacia dónde viajan los datos.

Para empresas que manejan información sensible — y en Perú y Latinoamérica eso incluye a casi cualquier empresa con clientes, contratos o estrategia comercial — la pregunta no es si implementar agentes de IA, sino cómo hacerlo sin comprometer el activo más valioso: el conocimiento interno que hace diferente a tu negocio.

En Consultoría-Ti acompañamos a empresas en el diseño e implementación de arquitecturas de IA que funcionan dentro de tu infraestructura, sin exponer datos sensibles a servicios externos. Si estás evaluando implementar un agente interno o quieres revisar la arquitectura de uno que ya tienes, conversemos — podemos ayudarte a construirlo bien desde el principio.

Fuentes y Referencias

Dev.to — Mohamed: "Architecting Secure AI Agents: The Fatal Flaw in Standard API Integrations"

✨ Contenido generado con ContentFlow — Consultoría-Ti

en Inteligencia Artificial

Nuestros blogs

Requisitos AI-Ready: el error que frena a tu equipo