FLUX
Todo lo que necesita saber para comprender y utilizar Flux AI
Flux es una innovadora suite de modelos de generación de imágenes desarrollada por Black Forest Labs, una nueva empresa de Inteligencia Artificial fundada por los creadores de Stable Diffusion.
Flux es capaz de producir imágenes impresionantes muy rápidamente, ofreciendo una eficiencia notable tanto para el fotorrealismo como para la ilustración y la creación gráfica.
Fiel a su visión de democratizar el acceso a la IA generativa, Black Forest Labs ofrece opciones para profesionales, desarrolladores y usuarios personales.
¿Cómo utilizar Flux?
Para utilizar Flux directamente en línea, Replicate, Fal.ai o DZine se encuentran entre los generadores de Flux en línea más populares.
Si desea instalar y utilizar Flux en su máquina, le recomendamos que utilice una interfaz gráfica completa como Forge o ComfyUI. Sin embargo, es posible instalar Flux para utilizarlo con un programa python, como se describe en Black Forest Labs Github.
Por último, también existen paquetes de alojamiento en la nube como Diffus o RunDiffusion que permiten utilizar Flux a través de una interfaz como si todo estuviera instalado en el propio ordenador, pero sin necesidad de gestionar la instalación ni disponer de una GPU potente.
Nuestras guías y tutoriales sobre el uso de Flux
Promptear Flux
Flux tiende a sobresalir con un prompt más verboso, de estilo narrativo, en lugar de las tradicionales etiquetas separadas por comas. Sin embargo, la plantilla es extraordinariamente flexible y responde muy bien a la experimentación, por lo que merece la pena que pruebes tus prompts SDXL o SD 1.5 para ver qué resultados obtienes.
Una de las cosas que realmente diferencia a Flux de otros modelos es su extraordinaria capacidad para renderizar texto -no sólo palabras, sino frases enteras- con una claridad impresionante. Esta característica por sí sola abre un mundo de posibilidades a los diseñadores que deseen integrar texto en sus imágenes.
Las diferentes versiones de Flux
Flux está disponible en tres versiones distintas, cada una diseñada para satisfacer necesidades específicas:
FLUX.1 [pro]
La versión Pro es la más potente de todas. Ofrece una calidad de imagen excepcional.
Sin embargo, esta versión no puede ser descargada directamente por los usuarios. Está reservada a los clientes profesionales que deseen integrar la potencia de Flux en sus propias aplicaciones y servicios a través de la API de Black Forest Labs.
FLUX.1 [dev]
Para desarrolladores e investigadores, Black Forest Lab ofrece la versión dev.
Incluye archivos abiertos, lo que permite una amplia personalización y experimentación. Los desarrolladores pueden adaptar Flux a sus necesidades específicas, explorar nuevas arquitecturas o ajustar el rendimiento en conjuntos de datos concretos.
Aunque potente, esta versión no está pensada para un uso comercial directo.
FLUX.1 [schnell]
Por último, la versión schnell es la más accesible del trío. De código abierto y gratuita, es ideal para proyectos personales, prototipos y experimentos a pequeña escala.
Aunque ligeramente menos potente que las versiones pro y dev, Flux schnell ofrece una generación de imágenes rápida y eficaz.
Su disponibilidad como código abierto significa que un amplio público, desde aficionados a estudiantes, puede descubrir y explotar las capacidades de Flux sin barreras financieras.
Imágenes creadas con Flux
Estos son algunos ejemplos de imágenes generadas con Flux AI
Flux en detalle
Un modelo híbrido
Flux utiliza una arquitectura híbrida que integra técnicas de difusión y transformación. Esto le permite generar imágenes de forma más eficiente, manteniendo al mismo tiempo una alta calidad visual. Este modelo es capaz de procesar indicaciones de texto sencillas para producir imágenes detalladas rápidamente, a menudo en menos de dos segundos.
Los transformadores** y los modelos de dispersión son dos arquitecturas clave en el campo de la inteligencia artificial.
Los transformadores, introducidos por el modelo «[Attention is All You Need]» (https://en.wikipedia.org/wiki/Attention_Is_All_You_Need), utilizan mecanismos de atención para procesar secuencias de datos, lo que permite un procesamiento paralelo y una mejor comprensión de las relaciones contextuales. Son ampliamente utilizados no sólo para la generación de imágenes, sino también en el procesamiento del lenguaje natural por LLM como ChatGPT.
Los modelos de difusión, por su parte, funcionan añadiendo gradualmente ruido a los datos y aprendiendo después a invertir este proceso para generar nuevos datos de alta calidad. Este enfoque ha demostrado un rendimiento excepcional en la generación de imágenes realistas, ofreciendo una alternativa estable y eficiente a los modelos generativos tradicionales como los GAN.
Juntas, estas dos arquitecturas han allanado el camino para importantes avances en la creación de contenidos multimedia y la inteligencia artificial.
Calidad excepcional
Según los informes de Black Forest Labs, Flux 1 establece un nuevo estándar en la síntesis de imágenes.
Los modelos Flux 1 Pro y Flux 1 Dev establecen nuevos estándares en sus respectivas categorías, superando a modelos populares como Midjourney v6.0, DALL-E 3 (HD) y Stable Diffusion 3-Ultra en cada uno de los siguientes aspectos: calidad visual, seguimiento de indicaciones, variabilidad de tamaño y aspecto, tipografía y diversidad de resultados.
Además, se dice que Flux 1 Schnell es el modelo más avanzado de su clase hasta la fecha, superando no sólo a sus competidores directos, sino también a potentes modelos no destilados como Midjourney v6.0 y DALL-E 3 (HD). Black Forest Labs añade que sus modelos están ajustados específicamente para preservar toda la diversidad de la salida de predestilación.
En comparación con los modelos anteriores, ofrecen posibilidades radicalmente mejoradas en términos de calidad, precisión y variedad de imágenes generadas.