Stable Diffusion XL

Tout ce qu’il faut savoir pour comprendre et utiliser SDXL

 
Stable Diffusion XL, también conocido como SDXL, es un modelo de última generación para la generación de imágenes de inteligencia artificial creado por Stability AI.
Destaca por su capacidad para generar imágenes más realistas, texto legible, rostros fotorrealistas, mejor composición de imágenes y estética mejorada, todo ello utilizando instrucciones más breves y sencillas que los modelos anteriores.
A pesar de estos avances, SDXL sigue la visión original de Stability AI: facilitar la creación de imágenes con IA a todo el mundo, ya sean frikis entusiastas, artistas o desarrolladores profesionales
notion image
 

Stable Diffusion XL online

Modifique el prompt de abajo y haga clic en el botón Generar para crear su imagen con SDXL
inspiración recopilado una serie de sugerencias inspiradoras y fáciles de usar para que empieces a utilizar SDXL y generes imágenes asombrosas
 

¿Cómo se utiliza SDXL?

Para uso directo en línea ClipDrop, PlayGroundAI o ArtBot se encuentran entre los generadores de imágenes en línea más populares
Si quieres instalar y utilizar Stable Diffusion XL en tu máquina, te recomendamos que utilices una interfaz gráfica como Fooocus, Automatic1111 o ComfyUI.
Por último, también existen paquetes de alojamiento en la nube, como Diffus y RunDiffusion, que le permiten utilizar Stable Diffusion XL como si estuviera instalado en su propio ordenador, pero sin necesidad de gestionar la instalación ni de disponer de una GPU potente
 

Requisitos del sistema

SDXL es un modelo muy amplio y completo, por lo que requiere más potencia de cálculo que Stable Diffusion V1.5.
Aunque se requiere un mínimo de 4 GB para la GPU, se recomienda utilizar una tarjeta con al menos 8 GB, siendo necesarios 12 GB para un uso realmente cómodo.
→ Consulta nuestro artículo para obtener más detalles sobre las GPU, CPU y RAM necesarias para ejecutar Stable Diffusion XL en tu ordenador

Instrucciones de uso

Scott, miembro del equipo de Estabilidad, ha compartido algunos consejos sobre el uso de SDXL 1.0 :
  • Indicación negativa: las indicaciones negativas ya no son tan importantes como lo eran en los modelos 1.5 y 2.1. Muchos términos negativos de uso común, como "extra fingers” (dedos de más) o "bad hands” (manos malas), son ahora completamente innecesarios
  • Prompt Weight : ya no es necesario utilizar una ponderación elevada de las palabras clave como en los modelos anteriores, y ahora se recomienda disminuir la ponderación de las palabras clave poco importantes en lugar de aumentar la de las demás
  • Safetensor: utilice siempre la versión .safetensor, no la .ckpt, que es más segura y no ejecutará código malicioso en su máquina
  • Tamaño de la imagen: el tamaño estándar es 1024×1024, pero SDXL admite diferentes tamaños.
    • Sin embargo, la calidad del resultado varía en función del tamaño. A continuación se indican los tamaños de imagen recomendados que se utilizan en DreamStudio, el generador de imágenes oficial de Stability AI:
    • 12:5 - 1536 x 640
    • 7:4 - 1344 x 768 (cercano a 16:9)
    • 19:13 - 1216 x 832 (casi 3:2)
    • 7:9 - 1152 x 896
    • 1:1 - 1024 x 1024
➡️
Consulte nuestro artículo completo sobre los formatos de imagen recomendados para SDXL
https://www.stablediffusion.blog/sdxl-image-ratio

Un modelo a la vanguardia de la generación de imágenes

¿Qué es SDXL?

El modelo SDXL es la evolución oficial del modelo v1.5 y se publica como software de código abierto.
Es un modelo mucho más grande (en el mundo de la IA, esto suele significar mejor): el número total de parámetros del modelo SDXL es de 6.600 millones, frente a los 0.980 millones del modelo v1.5.

¿Cuáles son las diferencias con la v1.5?

La principal diferencia es que SDXL consta en realidad de dos modelos: el modelo base y un Refiner, un modelo de refinamiento
notion image
continuación,el refinador añade los detalles más sutiles.
En práctica, SDXL se ejecuta dos veces: primero se ejecuta el modelo base y después el refinador. Tenga en cuenta que aún es posible ejecutar sólo el modelo base, con muy buenos resultados
En segundo lugar, el modelo de lenguaje (el módulo que incluye el texto de las instrucciones) es una combinación del modelo de código abierto de OpenClip (ViT-G/14) y el modelo ViT-L CLIP de OpenAI. Se trata de una elección acertada: Stable Diffusion v2 sólo utiliza OpenClip y se sabe que tiene problemas para comprender correctamente las instrucciones. La vuelta del CLIP de OpenAI facilita la comprensión del lenguaje
La U-Net, la parte más crucial del modelo de difusión, también es 3 veces mayor que en versiones anteriores. Combinado con el modelo lingüístico más grande, el modelo SDXL genera imágenes de alta calidad que se ajustan al prompt.
El tamaño de imagen por defecto de SDXL es de 1024×1024, que es 4 veces mayor que el modelo 512×512 v1.5.
A pesar de estas diferencias, las instrucciones que funcionen en la v1.5 tendrán muchas posibilidades de funcionar en SDXL, y eso es una buena noticia.

¿Qué diferencia hay con las versiones anteriores?

SDXL 1.O es el modelo de imagen estrella de Stability AI, considerado el mejor modelo de código abierto para la generación de imágenes. Los equipos de Stability lo han puesto a prueba frente a varios otros modelos, y el veredicto es claro: los usuarios prefieren las imágenes generadas por SDXL.
 
notion image

¿Cuáles son las ventajas de SDXL?

Stable Diffusion XL presenta una serie de mejoras con respecto a los modelos anteriores de Stable Diffusion, como el 2.1

Textos legibles

Una de las diferencias más notables entre SDXL y otros modelos de generación de imágenes por IA es su capacidad para generar texto legible.
Se trata de un avance significativo, ya que, aunque todavía imperfecta, esta funcionalidad no estaba disponible con los otros modelos de generación de imágenes.

Una mejor comprensión de la anatomía

Stable Diffusion XL representa un avance significativo en la generación de imágenes de figuras humanas. El modelo ha sido diseñado para producir imágenes de figuras humanas con una anatomía más precisa y realista. Esto significa que las imágenes generadas por SDXL tienen proporciones corporales correctas, rasgos faciales detallados y una representación más fiel de la forma humana.

Mensajes más cortos

SDXL también entiende las instrucciones breves mucho mejor que los modelos anteriores. No necesita largas descripciones llenas de palabras clave complicadas para obtener los resultados que desea: basta con un prompt breve. Esta mejora se debe en parte a la introducción de estilos que ayudan a guiar la generación de imágenes

Variedad de estilos artísticos

SDXL ofrece una gran variedad de estilos para generar imágenes, incluyendo: Anime, Fotográfico, Arte Digital, Cómics, Arte Fantástico, Película Analógica, Neon Punk, Isométrico, Low Poly, Origami, Line Art, Craft Clay, Cinematografía, Modelo 3D y Pixel Art.

Control avanzado y ajuste fino

Con SDXL 1.0, ajustar el modelo ahora un juego de niños
También es posible generar LoRA o puntos de control personalizados con mayor facilidad, sin tener que hacer tantos malabarismos con los datos y los parámetros como con los modelos antiguos
El equipo de Stability AI está trabajando duro en el desarrollo de la nueva generación de comandos dedicados a la estructura, el estilo y la composición, con adaptaciones T2I / ControlNet especialmente diseñadas para SDXL.

Imágenes creadas con SDXL

stos son algunos ejemplos de imágenes creadas con SDXL y compartidas en Civitai.com
https://civitai.com/images/2012423
https://civitai.com/images/2041581
https://civitai.com/images/1995857
https://civitai.com/images/2022565
https://civitai.com/images/1993805
https://civitai.com/images/2025811
https://civitai.com/images/2014509
https://civitai.com/images/2036768
https://civitai.com/images/1985944

Las diferentes versiones de SDXL

SDXL de Stability AI

Stability AI, la empresa creadora de Stable Diffusion, ha diseñado varias versiones de SDXL, cada una de las cuales aporta mejoras al modelo:

SDXL Turbo

notion image
Nuevo modelo de generación de imágenes en tiempo real compartido el 28 de noviembre de 2023.
Esta versión es muy diferente de las anteriores y se basa en una nueva técnica llamada ADD, que permite generar imágenes en tiempo real, sin sacrificar la calidad de la imagen.
SDXL Turbo está disponible para su prueba en clipdrop y también puede descargarse de HuggingFace.

SDXL 1.0

notion image
Es la versión final del modelo SDXL, publicada el 26 de julio de 2023.
Esta versión es la continuación de la 0.9, destinada exclusivamente a la investigación y cuyos resultados ya habían conquistado a la comunidad.
El código fuente de SDXL 1.0 está disponible en GitHub bajo la licencia de código abierto CreativeML OpenRAIL++-M
El modelo podrá utilizarse en varias plataformas, entre ellas ClipDrop, la API de la plataforma Stability AI la Discord Stable Foundation, Dreamstudio, AWS SageMaker y AWS Bedrock.

SDXL 0,9

notion image
SDXL 0.9 es una versión preliminar del nuevo modelo. Anunciada el 22 de junio de 2023, se beneficia de los resultados de la beta para mejorar aún más la calidad de las imágenes generadas
Desde su anunció, esta versión de SDXL se puso a disposición de los usuarios para que la probaran en varias plataformas, como Dreamstudio, ClipDrop y el Discord de la Fundación. El modelo también esta en HuggingFace, primero como modelo sólo para investigación y luego abiertamente

SDXL beta

notion image
La primera versión de SDXL es la versión beta, anunciada por Stability AI el 11 de abril de 2023 y anunciada como un nuevo modelo de generación de imágenes de nivel profesional con alta calidad fotorrealista
Fue accesible con un bot en el servidor Discord de Stability para que los miembros puedan probarlo.

Otras versiones de SDXL

Parque infantil v2.5

notion image
Compartido por Playground. el 28 de febrero de 2024, este modelo se basa en la misma arquitectura que SDXL y, por tanto, funciona de la misma manera, pero se ha entrenado con un conjunto de datos diferente y utilizando una serie de técnicas y optimizaciones innovadoras para lograr un mayor nivel de calidad

SDXL-Lightning

notion image
El 20 de febrero de 2024, ByteDance presentó esta versión de SDXL, optimizada para la generación rápida y casi instantánea de imágenes de 1024x1024 píxeles, utilizando la técnica ADD empleada para SDXL Turbo y combinándola con otras técnicas de destilación
Se divide en 4 versiones (1, 2, 4 y etapas de generación) y también está disponible en forma de LoRAs, lo que permite aplicar sus optimizaciones a otros modelos afinados de SDXL.

Hyper-SDXL

notion image
En abril de 2024, tras SDXL-Lightning, ByteDance compartió otra versión destilada e hiperrápida de Stable Diffusion XL, capaz de generar imágenes de 1024x1024 píxeles en tiempo casi real, con una calidad de imagen aún mejor.
Se comparte en forma de LoRAS, por lo que puede aprovechar las optimizaciones y la velocidad del modelo con cualquier otro modelo SDXL ajustado.

Modelos perfeccionados

Uno de los puntos fuertes de Stable Diffusion XL es que está disponible como código abierto, lo que lo convierte en el favorito de muchos diseñadores. En concreto, es posible tomar el modelo original y reajustarlo para mejorar sus capacidades. Estos se conocen como modelos reajustados, que funcionan como versiones alternativas de SDXL conservando sus características principales y su funcionamiento.
→ Consulta nuestro artículo Descubra los modelos Stable Diffusion para saber más sobre estos modelos

Artículos y tutoriales para SDXL