Implementación de Inteligencia Artificial en la Fotografía:
Un caso práctico
La Inteligencia Artificial (IA) está revolucionando múltiples sectores, desde la medicina hasta el entretenimiento. Sin embargo, en el ámbito de las artes gráficas, su aplicación aún despierta preguntas sobre su eficacia real y cómo puede integrarse en los procesos existentes. Hoy, quiero compartir una experiencia concreta de cómo en 14g.org utilizamos IA para un proyecto fotográfico, abordando no solo los aspectos técnicos, sino también los desafíos y las oportunidades que esta tecnología ofrece.
Ya habíamos incursionado en la IA a través de proyectos de generación de imágenes para industrias especializadas, utilizando Stable Diffusion y entrenamientos LoRA, y hemos alcanzado resultados notables, pero cuando una agencia de publicidad nos solicitó un proyecto de 81 fotografías para una cadena de restaurantes de comida rápida, sabíamos que nos enfrentábamos a un desafío completamente nuevo.
El Desafío: Reproducir la Esencia del Producto
El objetivo era claro: las imágenes debían reflejar con precisión no solo los ingredientes, sino también el estilo único de los platos que ofrece la cadena. Esto iba más allá de una simple generación de imágenes; se trataba de capturar la identidad visual del cliente y hacerla reproducible en un entorno de IA. Con esta premisa, nos embarcamos en un proyecto que requería un enfoque meticuloso y una fuerte colaboración entre tecnología y creatividad.
Fase 1: Recolección y Preparación del Material Visual
El primer paso fue reunir un conjunto de imágenes que servirían como base para el entrenamiento de la IA. El cliente proporcionó 232 fotografías de sus productos, algunas de las cuales habían sido tomadas hace varios años, lo que planteaba un desafío en términos de consistencia visual. Para complementar este material, decidimos realizar una nueva sesión de fotos utilizando nuestros iPhones, que nos permitió obtener 221 imágenes adicionales. Este esfuerzo era crucial para garantizar que la IA contara con un dataset lo suficientemente robusto y actualizado.
Fase 2: Entrenamiento de la IA
Con el material recopilado, el siguiente paso fue entrenar la IA para que pudiera replicar el estilo y los productos específicos del cliente. Aquí es donde entró en juego el uso de Fnas IA y la metodología LoRA (Low-Rank Adaptation). Realizamos un total de 19 entrenamientos: 7 enfocados en estilos visuales y 12 en la recreación precisa de los productos. Para ello, alquilamos un Fnas IA equipado con 4 GPUs y 64 GB de VRAM, lo que supuso un tiempo de computación de 121 horas. Adicionalmente, dedicamos 16 horas de trabajo de un especialista en IA para supervisar y ajustar los entrenamientos.
Este proceso fue fundamental para asegurar que la IA pudiera generar imágenes que no solo fueran visualmente atractivas, sino que también capturaran la esencia del producto del cliente. La fase de entrenamiento incluyó múltiples iteraciones, ajustando parámetros y probando diferentes enfoques hasta alcanzar un modelo que cumpliera con nuestras expectativas.
Fase 3: Generación de Imágenes
Con los modelos entrenados, pasamos a la fase de generación de imágenes. Utilizando un Fnas IA estándar con una RTX 4090 y la versión SDXL de Stable Diffusion, dedicamos dos días de trabajo intensivo a esta tarea. Con un equipo de dos personas, generamos un total de 3.265 imágenes, de las cuales seleccionamos cuidadosamente las 81 que cumplían con los requisitos del cliente.
El resultado fue más que satisfactorio. Aunque algunas imágenes no alcanzaron el nivel de fidelidad que se podría lograr con métodos tradicionales, la capacidad de la IA para producir imágenes de alta calidad en un corto periodo de tiempo demostró ser una ventaja significativa. Además, la flexibilidad que ofrece este sistema es inigualable: dado que la carta del cliente está en constante evolución, la agencia de publicidad puede utilizar los entrenamientos (LoRAs) ya realizados para generar nuevas imágenes en cuestión de minutos, manteniendo una consistencia estilística que sería difícil de lograr de otra manera.
Conclusión: La IA como Herramienta en la Industria Gráfica
Este proyecto no solo nos permitió explorar las capacidades de la IA en un nuevo contexto, sino que también nos brindó valiosas lecciones sobre su integración en la industria gráfica. La clave del éxito residió en la combinación de un enfoque técnico riguroso con una comprensión profunda de las necesidades estéticas del cliente.
Para empresas de artes gráficas, la IA ofrece una oportunidad única para aumentar la eficiencia y la capacidad de respuesta en proyectos que requieren un alto volumen de imágenes. Sin embargo, su implementación no es un proceso automático; requiere una planificación cuidadosa, una adecuada recolección de datos y una supervisión constante para asegurar que los resultados sean acordes a las expectativas.
En 14g.org, seguiremos explorando las posibilidades que la IA nos ofrece, siempre con el objetivo de mejorar nuestros servicios y ofrecer a nuestros clientes soluciones innovadoras que les permitan destacar en un mercado cada vez más competitivo.
Fernando Ulloa Langa
makero@14g.org
Agosto 2024