Do not index
Do not index
canonical-url
Publish
Publish
Uno de los usos más impresionantes y populares de las imágenes generadas por IA es la creación de personas y retratos realistas. Stable Diffusion es capaz de crear retratos tan realistas como fotografías reales, y hay innumerables imágenes generadas por IA que han pasado por reales a ojos del público.
Veamos cómo utilizar Stable Diffusion XL para crear fotos realistas. Empezaremos por escribir un prompt optimizado para fotos realistas antes de ver algunos modelos fotorrealistas que mejoran los resultados de SDXL
Genere Retratos Fotorrealistas
Prompts fotorrealistas
Prompt inicial
El prompt es la base de la generación de imágenes con Stable Diffusion, así que para una foto, como para cualquier imagen, hay que empezar con una descripción de lo que se quiere.
Stable Diffusion XL no necesita un prompt largo y complejo para crear imágenes interesantes, así que podemos empezar con un prompt bastante simple como este:
Retrato de una mujer rubia con camisa blanca
Ajustes para la generación en Automatic1111
A menos que se indique lo contrario, todas las imágenes de este artículo se generaron utilizando la siguiente configuración:
- Sampler : DPM++ 2S a Karras
- Steps : 50
- CFG Scale : 7
- Dimensiones: 832x1216
Aunque la imagen generada sea fotográfica, el prompt puede mejorarse directamente para demostrar que se trata efectivamente del renderizado fotográfico que deseamos.
Dependiendo de su prompt, utilice simplemente las palabras clave foto o fotografía al principio. Esta simple adición ya mejorará el resultado, como puede ver a continuación
¿Y por qué no fotorrealista?
Resulta tentador añadir la palabra photorealistic (fotorrealista) a nuestro prompt, pero si lo piensa bien, nadie utiliza esta palabra para describir una foto real.
Al contrario, se utiliza para describir imágenes que no son fotos pero se parecen a ellas: animación 3D, pintura, etc. Y como no queremos obtener este tipo de imagen, es mejor abstenerse de utilizar esta palabra.
Negative prompt
Stable Diffusion XL también utiliza un negative prompt, que le permite introducir palabras clave que no desea que aparezcan en su imagen.
Como queremos una foto, utilizaremos palabras clave negativas para indicar los otros tipos de imagen que no queremos:
ilustración, dibujos animados, anime, render 3d, pintura, crayón, boceto, grafito, impresionista, unreal engine
Intentemos esta pregunta negativa, manteniendo las preguntas anteriores y sus seed:
Para más información sobre este tema, consulte nuestro artículo sobre Prompt negativo en Difusión Estable.
Palabras clave de fotos
Podemos ir un paso más allá añadiendo una o varias palabras clave utilizadas para describir las fotos, que guiarán a Stable Diffusion XL aún más hacia una representación fotográfica, al tiempo que definen la imagen y el resultado final con mayor precisión.
Para todas las palabras clave que figuran a continuación, hemos utilizado los mismos prompt y seed, añadiendo sólo una palabra clave - esto le permite ver hasta qué punto influye (o no) en la foto y su realismo.
- La iluminación es un elemento clave en la fotografía y los fotógrafos han aprendido a dominarla desde hace mucho tiempo. A menudo es la calidad de la iluminación lo que hace que una foto sea buena. Stable Diffusion reconoce muchos tipos de iluminación que puedes utilizar en tus prompts: inspírate directamente de estos consjejos para los fotógrafos para encontrar iluminación que utilizar en tus prompts.
- Algunas cámaras, ya sean modernas o antiguas, tienen un estilo propio, y el uso de estas cámaras como palabras clave puede influir en la forma en que Stable Diffusion XL crea sus imágenes, aportando tanto estilo como realismo a tus fotos de IA
- el tipo de película fotográfica o las técnicas de procesado influirán de forma interesante en los resultados, al igual que la antigüedad de la foto y los elementos que la componen
- También puedes cambiar la imagen obtenida indicando la distancia focal. Como este parámetro depende muy a menudo del tipo de foto que el fotógrafo quiera obtener, influirá fácilmente en varios aspectos de la imagen, como su composición, la pose del modelo, la iluminación,…
- Incluso para los retratos, hay distintas opciones de encuadre: desde el primer plano (close-up) al cuerpo entero (full body) y hasta la cintura (down to the waist).
- Por último, si sabes algo de fotografía, no dudes en probar y utilizar otras palabras clave del mundo de la fotografía: enfoque, profundidad de campo, diafragma, exposición, balance de blancos, etc.
Otras palabras clave
Además del vocabulario y las palabras clave específicas de la fotografía, otras palabras clave pueden mejorar la calidad de las imágenes generadas y darles un aspecto aún más realista. He aquí algunas de ellas.
- El aspecto y la textura de la piel es un detalle que a menudo delata a las imágenes artificiales (IA o 3D). Para superarlo, se pueden utilizar (e incluso combinar) varias palabras clave para mejorar este aspecto en tus fotos: kin pores, highly detailed skin, skin details. Mencionar algunos defectos también puede evitar que se genere una piel demasiado perfecta para ser real: skin blemished, freckles, wrinkles…
- El indicador también puede utilizarse para dirigir la mirada del sujeto: ¿debe mirar hacia la cámara o a lo lejos?
- Mencionar el nombre de un fotógrafo, un estudio o un estilo fotográfico también puede realzar el aspecto y el realismo de tu foto
- También puedes añadir detalles a tus fotos especificándolos en tu pregunta. Los fotógrafos suelen utilizar atrezzo, es decir, objetos o elementos físicos que se añaden a un escenario para conseguir un efecto estilístico o emocional. Y aquí, ¡tu imaginación es tu único límite!
Ejemplos de indicaciones completas
Combinando varios de estos elementos y conceptos, podemos componer prompts completos capaces de generar retratos fotográficos realistas con Stable Diffusion XL. He aquí algunos ejemplos:
Modelos fotorrealistas
Uno de los puntos fuertes de Stable Diffusion es la posibilidad de entrenar y crear modelos que cambien la forma en que genera las imágenes. Ya en la versión 1.5, utilizaronciertos checkpoints o LoRA para mejorar el fotorrealismo de las imágenes. Este es obviamente el caso de SDXL, para el que se han creado varios modelos con el fin de producir fotos aún más realistas
Veamos algunos de estos modelos y cómo pueden utilizarse para crear fotos.
RealVisXL
Este modelo es, de hecho, una fusión de varios otros modelos fotorrealistas SDXL, una forma de intentar combinar lo mejor de varios modelos interesantes.
Oficialmente aún en fase de pruebas y creación, RealVisXL ya ofrece excelentes resultados y funciona muy bien para crear fotos realistas. Una de sus ventajas es que genera rostros menos "perfectos", lo que evita generar retratos con un aspecto excesivamente de revista o supermodelo.
Su creador recomienda utilizar un prompt negativo como el que se muestra a continuación y utilizar el muestreador Karras DPM++ SDE con 30 steps.
(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth
Utilizando estos parámetros e indicaciones como las desarrolladas anteriormente en este artículo, obtendrá unos resultados sorprendentes.
Realistic Stock Photo
Este punto de control combina la fusión de otros modelos con un entrenamiento específico a partir de fotos de bancos de imágenes. El resultado es un modelo bastante eficaz, sobre todo para retratos en primer plano de personas "normales".
El autor recomienda reducir la escala del cfg a 3 para los cierres. Yo también he reducido el número de steps para algunas pruebas, sin notar mucha diferencia. Sin embargo, ni siquiera los ejemplos de Civitai utilizan siempre el Prompt Negativo, así que he mantenido mi prompt negativo, más por costumbre que por otra cosa
Copax TimeLessXL
TimeLessXL es un modelo muy completo, entrenado para generar no sólo imágenes realistas, sino también en una gran variedad de estilos y géneros.
El autor recomienda utilizar el siguiente indicador negativo, que utilizaremos para nuestras pruebas.
(worst quality, low quality, illustration, 3d, 2d), open mouth, tooth,ugly face, old face, long neck,
Realities Edge XL
Este modelo promete nada menos que el mejor fotorrealismo SDXL, mejorando la falta de detalle y textura del modelo base, corrigiendo los defectos anatómicos que SDXL suele pasar por alto y ofreciendo una mayor variedad étnica.
Personalmente, no estoy seguro de que los retratos en primer plano tengan mejores texturas que otros modelos.
Aunque el autor recomienda DPM+ 3M SDE Karras, mis pruebas con otros samplers también son buenas.
Fotos realistas con SDXL
Como hemos visto, ahora es posible crear retratos fotorrealistas de una calidad impresionante. Estos avances no sustituyen a la fotografía real, pero ofrecen una nueva gama de herramientas para quienes buscan innovar, experimentar o incluso llenar lagunas en sus proyectos.
Aunque la elección del motivo y el modelo son fundamentales para obtener buenos resultados, lo que marcará la verdadera diferencia y hará que tus imágenes sean únicas es cómo piensas en tus imágenes, en sus sujetos y en sus composiciones antes de utilizar estas técnicas para crearlas. Stable Diffusion XL puede, en efecto, generar la foto por ti, pero no puede imaginarla por ti.
Written by