Lanzamiento de Playground v2.5
Do not index
Do not index
canonical-url
Publish
Publish
Uno de los puntos fuertes Stable Diffusion XL es su naturaleza de código abierto: el modelo ha sido compartido por su creador, Stability AI, bajo una licencia de código abierto, lo que significa que otros creadores pueden utilizar, modificar y mejorar SDXL, siempre que también lo compartan libremente
ByteDance lo hizo recientemente con SDXL Lightning y Playground IA acaba de anunciar una nueva versión de su modelo de generación de imágenes: Playground 2.5
IA del patio de recreo
Playground AI plataforma en línea que integra herramientas de creación y edición de imágenes basadas en Stable Diffusion y otras tecnologías de IA. Con su oferta gratuita y varias opciones de suscripción, Playground AI se dirige tanto a usuarios ocasionales como a profesionales que buscan una herramienta completa y potente
El modelo Playground 2.5
Playground v2.5 es un modelo de código abierto de última generación en cuanto a calidad estética, con especial atención a la mejora del color y el contraste y al perfeccionamiento de los detalles de las figuras humanas y los personajes.
Con esta versión, el equipo de IA de Playground ha optado intencionadamente por superar los límites de la arquitectura SDXL actual: la exploración de nuevas arquitecturas como Stable Cascade o la próxima Stable Diffusion3 deliberadamente en suspenso para que podamos ofrecer mejoras rápidamente a los usuarios de Playground y a la comunidad de Stable Diffusion
Incluso con la arquitectura actual, sus métodos permiten un aumento significativo y sorprendente de la calidad estética de las imágenes generadas, hasta el punto de superar a la mayoría de los demás modelos de código abierto o propietarios, como DALL-E 3 y Midjourney.
Ejemplo de resultados
El modelo se ha compartido en beta privada con algunos usuarios de Playground AI que ya han podido crear estas impresionantes imágenes:
Disponibilidad de modelos
Descargar Playground 2.5
Al igual que su predecesor, Playground 2.5 es de código abierto compartido y, por tanto, puede descargarse y utilizarse libremente con la mayor parte de la interfaz diseñada para Stable Diffusion XL.
Sin embargo, requiere una adaptación técnica que actualmente sólo está disponible en ComfyUI - sólo podemos esperar que otras interfaces sean compatibles en un futuro próximo.
Utilizar Playground 2.5 en línea
supuesto, el modelo puede utilizarse directamente plataforma Playground.com que permite generar hasta 500 imágenes gratuitas al día
modelo también se ha integrado en la plataforma Poe, que ofrece varios chatbots, incluido un nuevo Playground-v2.5 puede pedir que genere imágenes
Por último, el modelo puede utilizarse en línea en plataformas en la nube como Diffus, que permiten cargar y utilizar los modelos, puntos de control y LoRA de su elección
Uso de Playground 2.5 con Fooocus
Fooocus, una interfaz de difusión estable fácil de instalar y utilizar, permite utilizar Playground 2.5 con un preajuste de configuración específico
Para utilizarlo, puedes seleccionar playground_v2. la lista de preajustes que aparece en la parte superior de la columna de la derecha cuando marcas advanced en el campo prompt. También puedes aplicar el preajuste directamente en el arranque añadiendo el argumento -preset playground_v2.5 al comando de arranque, como se explica en nuestro artículo sobre preajustes.
Usando Playground 2.5 con ComfyUI
En Openart.aiencontrarás varios flujos de trabajo para utilizar Playground 2. , que te permitirán familiarizarte con el modelo y ver qué ajustes puedes utilizar para incorporarlo a tus flujos de trabajo y utilizarlo para tu generación
Detalles del modelo
Playground 2.5 se ha construido y entrenado utilizando contribuciones de la comunidad de código abierto, en particular la familia de modelos de imagen basados en Stable Diffusion. Es la continuación lógica de los modelos anteriores (Playground 1 y Playground 2), que se benefician de la investigación y el aprendizaje del equipo de investigadores de Playground.
En concreto, esta nueva versión pretende corregir o cerrar los fallos detectados tras el lanzamiento de la versión 2.0. Se han abordado tres cuestiones críticas: la mejora del color y el contraste, la mejora de la generación de distintos formatos y la mejora del detalle fino de las representaciones humanas.
En términos más generales, el equipo ha tratado de perfeccionar las capacidades del modelo para producir resultados más realistas y visualmente convincentes.
Color y contraste mejorados
Por lo general, los modelos de difusión latente tienen dificultades para generar imágenes con colores vivos y alto contraste. Ésta ha sido una limitación conocida desde SD1.5 e incluso SDXL, a pesar de una notable mejora, sigue teniendo dificultades para generar una imagen con colores puros y no siempre es bueno para crear sujetos sobre fondos de un solo color.
DXL y Playground v2 utilizan un método llamadoOffset Noisepara limitar el problema .Playground v2.5 utiliza una solución más radical con el entrenamiento reanudado en 0 utilizando el marco EDM
Generación mejorada en distintos formatos
Los procedimientos de preentrenamiento utilizados habitualmente para los modelos de difusión comienzan con imágenes cuadradas (formato 1:1) en las primeras etapas, con recortes aleatorios o centrales a partir de entonces. En teoría, esto no debería suponer un problema. Por desgracia, en la práctica, los modelos de difusión entrenados de este modo no se generalizan bien a otros formatos y tamaños.
Por ello, Playground 2.5 se ha entrenado con especial cuidado en la selección de datos para garantizar una amplia variedad de formatos de imagen y utilizando un método de agrupación de formatos similar al de SDXL. Al aplicar una estrategia más refinada y equilibrada que SDXL, Playground 2.5 no tiene prácticamente ninguna dificultad para crear imágenes de calidad en cualquier formato.
Mejora humana
Los humanos somos especialmente sensibles a los errores visuales en rasgos humanos como manos, caras y cuerpos. Una imagen con una iluminación perfecta y una composición y estilo excelentes se considerará de baja calidad si la cara está mal formada o la estructura del cuerpo contorsionada.
Para evitar este tipo de distorsión, Playground 2.5 utiliza un método de alineación particular inspirado enalineación UEM próxima a la estrategia antialucinación utilizada para mejorar modelos lingüísticos como ChatGPT o Mistral
Esta estrategia ofrece resultados muy mejorados para la composición y expresión facial, los ojos y la mirada y la textura del cabello.
Evaluación del modelo
Se han realizado estudios para evaluar la calidad estética general del modelo y las áreas específicas de mejora en Playground v2.5, incluidas las relaciones de aspecto múltiples y las representaciones humanas mejoradas.
Playground v2.5 ha superado en calidad estética a los actuales modelos de código abierto SDXL y PixArt-α, así como a la versión anterior Playground v2, e incluso a modelos propietarios punteros como DALL-E 3 y Midjourney v5.2.
En cuanto a los formatos de imagen, Playground v2.5 también demostró un rendimiento superior en comparación con SDXL.
En el caso de las imágenes relacionadas con personas, diseñadas para probar el renderizado de rasgos humanos, Playground v2.5 ha superado significativamente a los modelos base más utilizados, como SDXL y RealStock v2.
Un modelo de código abierto de alta calidad
Con su labor de investigación y la puesta en común de Playground v2.5, Playground AI contribuye activamente al desarrollo de soluciones de código abierto para la generación de imágenes mediante inteligencia artificial.
Sus modelos demuestran tanto la validez y eficacia de las técnicas de entrenamiento y generación de imágenes desarrolladas con Stable Diffusion, como la importancia de la comunidad Open Source y los beneficios que puede ofrecer este tipo de distribución y puesta en común.
Todavía estamos sólo al principio de las posibles mejoras y oportunidades que abren los modelos de distribución de código abierto, y el trabajo de Playground AI, como el de los demás colaboradores, es esencial si queremos seguir avanzando y explorando todo este potencial.