El laboratorio japonés Sakana AI ha lanzado al mercado dos innovadoras herramientas, Fugu y Fugu Ultra, que prometen revolucionar el panorama de la inteligencia artificial al coordinar múltiples modelos de diferentes proveedores a través de una única interfaz de programación (API). Este anuncio, fechado el 22 de junio de 2026, llega en un momento clave para el sector, marcado por restricciones gubernamentales y la creciente dependencia de unos pocos actores dominantes.

Un rendimiento comparable a los gigantes

Según datos proporcionados por la compañía con sede en Tokio, Fugu Ultra logra equiparar el desempeño de modelos de primer nivel como Claude Fable 5 y Mythos Preview en las pruebas más exigentes de ingeniería, ciencia y razonamiento. La particularidad más destacada es que este sistema no depende de ningún proveedor en exclusiva, sino que orquesta los recursos de varios para lograr resultados óptimos.

Contexto regulatorio y ventaja estratégica

El lanzamiento se produce apenas nueve días después de que el gobierno estadounidense ordenara a Anthropic suspender el acceso a sus modelos Fable 5 y Mythos 5 para usuarios extranjeros, alegando motivos de seguridad nacional. Esta medida afectó a miles de desarrolladores y empresas que habían integrado dichos modelos en sus operaciones cotidianas. Frente a esta realidad, Sakana AI plantea una solución resiliente: si algún proveedor corta el acceso a uno de los modelos de su pool, el sistema puede redirigir las tareas hacia alternativas sin interrumpir el servicio.

ANUNCIO

Arquitectura técnica y origen

Sakana AI fue fundada por investigadores que participaron en la redacción del artículo académico original sobre la arquitectura Transformer, base de la mayoría de los modelos de lenguaje actuales. La compañía explica que su enfoque no consiste en entrenar un modelo más grande, sino en coordinar los mejores disponibles para cada tarea específica. Fugu asigna roles de pensador, ejecutor y verificador entre distintos modelos, sintetiza las respuestas y puede invocarse a sí mismo de forma recursiva para problemas complejos. El soporte teórico proviene de dos trabajos presentados en la conferencia ICLR 2026: TRINITY, que describe el sistema de coordinación, y Conductor, que entrena al coordinador mediante aprendizaje por refuerzo.

Resultados y versiones disponibles

En las pruebas internas reportadas por Sakana AI, Fugu Ultra alcanzó 95,1 puntos en GPQA-Diamond y 73,7 en SWE-Bench Pro. La firma sostiene que estas cifras superan a Claude Opus 4.8, GPT-5.5 y Gemini 3.1 Pro en la mayoría de las evaluaciones realizadas, y que quedan al mismo nivel que Fable 5 en aquellos benchmarks donde existe comparación directa. No obstante, cabe señalar que Fable 5 y Mythos no están incluidos en el pool de Fugu al no ser accesibles públicamente, por lo que la comparación es indirecta. El sistema se comercializa en dos versiones: Fugu, orientado a tareas cotidianas como programación y chat con baja latencia; y Fugu Ultra, diseñado para trabajos de larga duración como investigación autónoma, reproducción de artículos científicos, análisis de patentes y evaluaciones de ciberseguridad. Ambas son accesibles mediante una API compatible con OpenAI, con planes de suscripción para usuarios individuales y pago por uso para cargas empresariales.

Debate en la comunidad técnica

Los resultados, sin embargo, provienen de informes internos y no han sido verificados de forma independiente. En foros técnicos, investigadores y desarrolladores han señalado que los sistemas de orquestación multiagente tienden a obtener mejores puntuaciones en pruebas de razonamiento de múltiples pasos, donde la coordinación entre modelos especializados ofrece una ventaja real, pero que esa ganancia puede ser menor en tareas simples o de baja latencia debido a la sobrecarga de coordinación. Asimismo, la dependencia de proveedores sigue siendo un factor sin resolver: si alguno de los modelos del pool de Fugu restringe su acceso por decisión regulatoria o comercial, la capacidad de Sakana para sustituirlo dependerá de que existan alternativas con rendimiento comparable en ese momento.

ANUNCIO