OpenClaw: La IA local que ce cosas

OpenClaw: la IA local que hace cosas

OpneClaw: La IA que hace cosas.

En 14g.org llevamos probando OpenClaw desde enero de 2026, con instalaciones operativas en nuestros servidores Fnas del laboratorio técnico, lo que nos ha permitido sólo evaluar su comportamiento en condiciones casi reales. No se trata, por tanto, de una aproximación superficial o meramente exploratoria, sino de un proceso de ensayo sostenido en el tiempo, con vocación claramente aplicada.

Conviene, en primer término, establecer con rigor qué es OpenClaw: no estamos ante un simple interfaz conversacional ni ante una extensión de los modelos de lenguaje tradicionales que operan exclusivamente en la nube. OpenClaw es, esencialmente, un agente de inteligencia artificial que puede residir en un entorno local, instalado en un ordenador o en un servidor, y que no se limita a “hablar” con el usuario, sino que es capaz de ejecutar acciones, interactuar con el sistema, automatizar procesos y, en definitiva, operar como un intermediario activo entre el usuario y la máquina. Esta diferencia, que puede parecer sutil en una primera aproximación, resulta determinante cuando se traslada al ámbito productivo.

Al mismo tiempo que OpenClaw ha ido ganando presencia, han aparecido otros agentes impulsados por distintos proveedores configurando un ecosistema en rápida expansión. La decisión de optar por OpenClaw en nuestro laboratorio no obedece a una exclusividad tecnológica, ya que seguimos experimentando con múltiples soluciones, sino a una característica que consideramos crítica: su capacidad de funcionamiento completamente local, sin necesidad de enviar información a terceros. Esta condición, que en otros contextos podría interpretarse como una ventaja más, se convierte en un requisito imprescindible en sectores como el de las artes gráficas, donde los trabajos de los clientes no pueden abandonar el perímetro de la empresa.

En nuestras pruebas, OpenClaw ha sido utilizado con distintos modelos de inteligencia artificial en la nube —incluyendo ChatGPT, Gemini, Claude y otros— con resultados, en términos generales, excelentes. Sin embargo, una parte sustancial del esfuerzo se ha centrado en sistemas de inteligencia artificial local, como Ollama o LM Studio, empleando motores de código libre desplegados en hardware que abarca desde equipos compactos tipo iMac mini hasta servidores Fnas equipados con GPU RTX 4090 y sistemas operativos Debian 13. Los resultados obtenidos en este ámbito han sido, sin exageración, sorprendentes, hasta el punto de que la conclusión a la que hemos llegado es clara: la inteligencia artificial de código libre, ejecutada en local, ha alcanzado un nivel de madurez que permite su utilización real.

Ahora bien, de este análisis no se desprende una dicotomía excluyente entre inteligencia artificial local e inteligencia artificial en la nube. Antes al contrario, la evidencia acumulada sugiere que no hay que elegir entre una y otra, sino aprender a convivir con ambas de forma estratégica. La mayoría de los problemas rutinarios del día a día —incluyendo la ejecución de flujos de trabajo agénticos, es decir, tareas encadenadas que pueden ser delegadas en un agente como OpenClaw— no requieren el modelo razonador más potente disponible en el mercado. Un modelo pequeño o mediano, ejecutándose en un servidor local, es perfectamente capaz de resolverlos con solvencia. Sin embargo, cuando entramos en el terreno de la creación de agentes, la programación avanzada o determinadas tareas de alto nivel, sí resulta necesario recurrir a modelos más potentes, habitualmente accesibles a través de servicios en la nube.

Es precisamente en esa combinación —inteligencia local para la ejecución cotidiana, inteligencia en la nube para el diseño y la resolución compleja— donde reside, a mi juicio, la clave del éxito y, no menos importante, del ahorro de costes. En 14g hemos utilizado ChatGPT5 para crear los agentes y luego los hemos ejecutado localmente con Ollama rodando en uno de nuestros Fnas de IA. El resultado de esta hibridación ha sido excepcionalmente productivo, tanto en términos de rendimiento como de eficiencia operativa y económicos.

Ahora bien, conviene introducir una precisión que, aunque pueda parecer evidente, no siempre se formula con la claridad necesaria: con OpenClaw no estamos haciendo nada que no se pudiera hacer antes. La diferencia no reside en la posibilidad, sino en el procedimiento. Antes, para automatizar una tarea o ejecutar una secuencia de acciones, era necesario desarrollar un programa específico, definir su lógica, implementarlo, probarlo y mantenerlo. Ahora, en muchos casos, ese mismo resultado se obtiene simplemente hablando con el agente. La barrera de entrada no es ya el conocimiento de un lenguaje de programación, sino la capacidad de expresar correctamente una intención.

Para entender este cambio, es imprescindible descomponer qué es, en términos operativos, un agente como OpenClaw. Todo agente se articula sobre cuatro elementos fundamentales, cuya combinación determina su comportamiento:

En primer lugar, el modelo de lenguaje. Es el núcleo cognitivo del sistema, el responsable de interpretar las instrucciones, generar respuestas y tomar decisiones dentro del margen que se le ha definido. Este modelo puede ser prácticamente cualquiera: desde servicios en la nube como ChatGPT o Claude, hasta modelos ejecutados en local mediante sistemas como Ollama. Su calidad, tamaño y especialización condicionan directamente la capacidad del agente para razonar, comprender contexto y adaptarse a situaciones nuevas.

En segundo lugar, las conexiones o herramientas. Son los mecanismos que permiten al agente interactuar con el exterior: acceder a archivos, ejecutar comandos, consultar bases de datos, invocar APIs o manipular aplicaciones. Existen literalmente cientos de herramientas disponibles para OpenClaw, desde integraciones con sistemas de archivos locales, automatización de escritorio o ejecución de scripts, hasta conexiones con servicios externos como gestores de correo, plataformas de almacenamiento en la nube, sistemas ERP o software específico de producción gráfica, incluyendo también la capacidad de manejar un navegador web de forma automatizada para consultar páginas, extraer información o interactuar con servicios online. Sin estas herramientas, el agente quedaría reducido a un mero interlocutor; con ellas, se convierte en un operador.

En tercer lugar, la memoria persistente. No se trata únicamente de almacenar datos, sino de mantener contexto a lo largo del tiempo: recordar interacciones previas, estados de procesos, decisiones tomadas o información relevante para tareas futuras. La memoria es lo que permite que el agente no empiece siempre desde cero.

Y, en cuarto lugar, las habilidades. Bajo este término agrupamos los comportamientos predefinidos o aprendidos que permiten al agente ejecutar tareas concretas: desde generar un archivo PDF hasta preparar un flujo de preimpresión o validar un conjunto de datos. Pero, además, las habilidades cumplen una función esencial: le dicen al agente cómo debe utilizar las herramientas de las que dispone. Es decir, no basta con tener acceso a un navegador, a un sistema de archivos o a una API; es necesario definir de qué manera se usan, en qué orden y con qué propósito. Las habilidades son, en cierto modo, la traducción práctica de todo lo anterior.

Sobre el papel, esta arquitectura resulta sólida. En la práctica, sin embargo, nos encontramos con una realidad menos pulida. Aunque OpenClaw y herramientas similares se presenten envueltas en forma de producto terminado, lo cierto es que, a día de hoy, se comportan como proyectos en estado alfa, ni siquiera beta. No han sido probados de forma suficientemente exhaustiva en entornos reales, y ello se traduce en errores que, en ocasiones, resultan difíciles de prever: actualizaciones que rompen configuraciones previamente estables, comportamientos inconsistentes o fallos que aparecen sin una causa aparente.

A esta situación se suma un aspecto especialmente delicado: la seguridad. El hecho de que podamos instruir a un agente para que ejecute acciones en nuestro sistema implica, necesariamente, que dichas acciones deben estar sometidas a una capa de control rigurosa. No estamos simplemente escribiendo texto; estamos dando órdenes que pueden afectar a archivos, procesos o infraestructuras completas. Y aquí surge una cuestión de fondo: los humanos aún no estamos plenamente preparados para interactuar con las máquinas en estos términos. No tenemos interiorizados los modelos mentales necesarios para evaluar riesgos en tiempo real mientras “conversamos” con un sistema que ejecuta lo que le pedimos.

La consecuencia es evidente: la seguridad se convierte en uno de los principales problemas de OpenClaw. No tanto por una vulnerabilidad concreta, sino por la combinación de potencia operativa, facilidad de uso y ausencia de una cultura consolidada de control en este tipo de interacción. Es, probablemente, uno de los ámbitos donde más trabajo queda por delante antes de que estos agentes puedan considerarse aptos para entornos de producción exigentes.

Existe, además, un segundo dilema, quizá menos evidente pero igualmente relevante: disponemos de la herramienta, pero no siempre sabemos qué hacer con ella. Tenemos un pincel, pero no sabemos que pintar. Estos agentes son capaces de realizar, con mayor o menor dificultad en su configuración —¿o deberíamos decir en su entrenamiento?—, prácticamente cualquier tarea que pueda ejecutarse en un ordenador. La cuestión, por tanto, no es tanto la capacidad, sino la definición del uso.

En el laboratorio de desarrollo de 14g estamos trabajando con estos agentes precisamente en esa dirección: explorar, experimentar, identificar aplicaciones concretas, especialmente en entornos de preimpresión, donde la automatización inteligente puede introducir mejoras sustanciales en eficiencia y calidad. El proceso, inevitablemente, implica ensayo y error, formulación de hipótesis, validación práctica y, en no pocas ocasiones, reformulación completa del enfoque inicial.

Porque, al final, la pregunta permanece abierta: ¿qué podemos hacer exactamente con OpenClaw y con los agentes que están por venir? La respuesta no es única ni inmediata, pero sí parece segura una cosa: en muy poco tiempo, tendremos que volver a hablar de ello, y lo haremos —previsiblemente— desde un escenario en el que estas herramientas ya no serán una promesa, sino una realidad operativa consolidada.

Fernando Ulloa Langa
makero@14g.org
www.14g.org