Fugu Ultra de Sakana AI: cuando orquestar modelos es más poderoso que tener el mejor modelo
Durante meses, la conversación en IA giró en torno a una sola pregunta: ¿qué modelo es el más inteligente? GPT contra Claude contra Gemini. Benchmark contra benchmark. Pero en junio de 2026, Sakana AI llegó con una propuesta que cambia el marco completo: ¿y si el verdadero poder no está en el modelo, sino en cómo se coordinan varios modelos entre sí?
Eso es exactamente lo que propone Sakana Fugu, y su versión más avanzada, Fugu Ultra. No es un modelo más grande. Es un sistema de orquestación multi-agente que supera en múltiples benchmarks a GPT 5.5, Gemini 3.1 Pro y Claude Opus 4.8, no por tener más parámetros, sino por saber mejor cómo distribuir el trabajo.
En este artículo analizamos cómo funciona, qué resultados ha mostrado y por qué esto importa para empresas en Perú y América Latina que están tomando decisiones de adopción de IA hoy.
¿Cómo funciona Fugu? La arquitectura que lo hace diferente
La idea central de Fugu es simple pero poderosa: en lugar de ser un modelo monolítico que intenta resolverlo todo, Fugu es un LLM entrenado para llamar a otros LLMs, incluyendo instancias de sí mismo de forma recursiva. Actúa como un director de orquesta que conoce las fortalezas y debilidades de cada músico.
Desde el exterior, el sistema se comporta como un modelo único: tú envías una solicitud a un endpoint, y Fugu decide internamente cómo manejarla. Puede resolver el problema directamente si es suficientemente simple, o puede coordinar un equipo de modelos especializados cuando la tarea lo requiere. La complejidad del sistema multi-agente nunca llega a tu código.
Al lanzamiento, Sakana ofrece dos versiones accesibles vía API. Fugu está orientado al trabajo cotidiano: buena performance con baja latencia, ideal para integraciones en herramientas de código, chatbots y servicios interactivos. Fugu Ultra, en cambio, está optimizado para problemas complejos de múltiples pasos donde la calidad de la respuesta es lo más importante, coordinando un pool más profundo de agentes expertos.
Un detalle técnico clave: si un modelo del pool no está disponible —por ejemplo, bloqueado por controles de exportación— Fugu simplemente lo reemplaza por otro. Sakana presenta esto como una ventaja de soberanía de IA, un argumento que resuena especialmente en mercados como el latinoamericano donde la dependencia de proveedores externos es una preocupación real.
Los benchmarks: ¿qué tan bien funciona en la práctica?
Los resultados publicados por Sakana AI son llamativos. En LiveCodeBench, un benchmark de programación competitiva diseñado para evitar contaminación de datos de entrenamiento, Fugu Ultra supera a Fable 5, GPT 5.5, Gemini 3.1 Pro y Opus 4.8 por un margen considerable. En GPQA-D, un benchmark de razonamiento científico que muchos consideran ya saturado, Fugu Ultra logra mejoras incrementales pero consistentes.
En SWE Bench Pro, la historia es más matizada. Este benchmark evalúa si un agente puede resolver tareas reales de ingeniería de software de largo horizonte. Aquí Fugu Ultra no supera a Fable 5, y la razón es arquitectónica: Fable 5 fue diseñado específicamente para tareas de larga duración continua, mientras que Fugu Ultra está optimizado para resolver con máxima calidad problemas complejos pero discretos. No es una debilidad oculta, es una diferencia de diseño que los propios creadores reconocen abiertamente.
Más allá de los benchmarks formales, Sakana publicó casos de uso que demuestran capacidades concretas. En una prueba de investigación autónoma de machine learning, Fugu Ultra ejecutó más de 100 experimentos en 14 horas sobre una GPU H100, iterando sobre código de entrenamiento y mejorando sistemáticamente el error de validación de un modelo GPT pequeño. En una simulación de trading con $10,000 iniciales durante 50 semanas históricas, Fugu Ultra alcanzó un retorno del 20% mientras los otros modelos frontier no superaron el 15%. En pruebas de diseño mecánico CAD y resolución de cubos de Rubik desde cero en Python puro, Fugu Ultra fue el único sistema que completó las tareas con éxito funcional.
¿Qué significa esto para empresas en Perú y LATAM?
La aparición de sistemas como Fugu Ultra cambia una pregunta que muchos gerentes y directores de tecnología en la región se están haciendo: ¿qué modelo de IA debo adoptar? La respuesta correcta cada vez más no es un modelo específico, sino una arquitectura que pueda aprovechar los mejores modelos disponibles según la tarea.
Para empresas medianas en Perú y América Latina, esto tiene implicancias prácticas inmediatas. Primero, la flexibilidad ante cambios regulatorios o de disponibilidad de modelos se vuelve un activo estratégico. Si hoy dependes exclusivamente de un proveedor y ese proveedor cambia sus condiciones, precios o disponibilidad, tu operación queda expuesta. Un sistema orquestador como Fugu reduce esa dependencia.
Segundo, los casos de uso más valiosos para empresas de la región —análisis de documentos complejos, automatización de procesos de múltiples pasos, investigación de mercado, generación de reportes técnicos— son exactamente el tipo de tareas donde la orquestación multi-agente muestra sus mayores ventajas frente a un modelo único.
Tercero, y quizás lo más importante: el costo de equivocarse en la elección de infraestructura de IA es cada vez más alto. Las empresas que están construyendo sus flujos de automatización hoy sobre un único modelo están asumiendo un riesgo de obsolescencia que podría evitarse con una arquitectura más flexible desde el inicio.
¿Cómo aplica esto en tu empresa?
Si estás evaluando integrar IA en tus procesos de negocio, estas son las preguntas concretas que deberías hacerte antes de comprometerte con una solución específica:
- ¿Tus tareas son simples y repetitivas, o complejas y de múltiples pasos? Para tareas simples, un modelo único y bien configurado suele ser suficiente y más económico. Para tareas complejas —análisis de contratos, investigación técnica, generación de código funcional— los sistemas multi-agente como Fugu empiezan a mostrar ventajas reales.
- ¿Qué tan dependiente quieres ser de un único proveedor de IA? La soberanía tecnológica no es solo un concepto político; es una decisión de arquitectura con consecuencias operativas directas.
- ¿Tu equipo técnico está preparado para trabajar con APIs de orquestación? Fugu no es una interfaz de chat. Requiere integración vía API, lo que implica capacidades de desarrollo que deben estar presentes o construirse.
- ¿Cómo se integra con tus sistemas existentes? Si ya tienes un ERP como Odoo, o flujos de automatización construidos con herramientas como n8n, la integración de un orquestador de IA debe planificarse para que amplifique lo que ya funciona, no para reemplazarlo todo.
El acceso a Fugu Ultra es vía API en sakana.ai, con opciones de suscripción y pago por uso. Vale la pena mencionar que el sistema consume créditos de forma intensiva dado que coordina múltiples modelos en paralelo, por lo que la evaluación de costos debe hacerse con datos reales de tu volumen de uso antes de escalar.
Conclusión
Fugu Ultra no es el modelo más inteligente del mercado en todas las dimensiones. Pero demuestra algo más importante: que la próxima frontera de la IA aplicada no está en modelos más grandes, sino en sistemas que coordinan mejor los modelos que ya existen. Para empresas en Perú y LATAM, esto significa que la decisión estratégica no es solo qué modelo usar, sino qué arquitectura de IA construir para los próximos años.
En Consultoría-Ti ayudamos a empresas de la región a tomar exactamente ese tipo de decisiones: no solo qué herramienta adoptar, sino cómo integrarla de forma que genere valor real en sus operaciones, sin depender de una sola tecnología ni de un solo proveedor.
Si estás evaluando cómo incorporar inteligencia artificial en tus procesos de negocio o quieres entender qué arquitectura tiene más sentido para tu empresa, conversemos sin compromiso. Estamos aquí para ayudarte a tomar la decisión correcta.
Fuentes y Referencias
TheAiGrid — Sakana AI's New "Fugu Ultra" Beats Claude Fable 5 (Sakana Fugu)
✨ Contenido generado con ContentFlow — Consultoría-Ti