Crea fotos realistas con Stable Diffusion XL

Do not index

canonical-url

Publish

Uno de los usos más impresionantes y populares de las imágenes generadas por IA es la creación de personas y retratos realistas. Stable Diffusion es capaz de crear retratos tan realistas como fotografías reales, y hay innumerables imágenes generadas por IA que han pasado por reales a ojos del público.

Veamos cómo utilizar Stable Diffusion XL para crear fotos realistas. Empezaremos por escribir un prompt optimizado para fotos realistas antes de ver algunos modelos fotorrealistas que mejoran los resultados de SDXL

Genere Retratos Fotorrealistas

Prompts fotorrealistas

Prompt inicial

El prompt es la base de la generación de imágenes con Stable Diffusion, así que para una foto, como para cualquier imagen, hay que empezar con una descripción de lo que se quiere.

Stable Diffusion XL no necesita un prompt largo y complejo para crear imágenes interesantes, así que podemos empezar con un prompt bastante simple como este:

Retrato de una mujer rubia con camisa blanca

🛠

Ajustes para la generación en Automatic1111

A menos que se indique lo contrario, todas las imágenes de este artículo se generaron utilizando la siguiente configuración:

Sampler : DPM++ 2S a Karras

Steps : 50

CFG Scale : 7

Dimensiones: 832x1216

Aunque la imagen generada sea fotográfica, el prompt puede mejorarse directamente para demostrar que se trata efectivamente del renderizado fotográfico que deseamos.

Dependiendo de su prompt, utilice simplemente las palabras clave foto o fotografía al principio. Esta simple adición ya mejorará el resultado, como puede ver a continuación

Photographic portrait of a blond woman wearing a white shirt

Photo of an african-american man in new york, wearing a business suit

❓

¿Y por qué no fotorrealista?

Resulta tentador añadir la palabra photorealistic (fotorrealista) a nuestro prompt, pero si lo piensa bien, nadie utiliza esta palabra para describir una foto real.

Al contrario, se utiliza para describir imágenes que no son fotos pero se parecen a ellas: animación 3D, pintura, etc. Y como no queremos obtener este tipo de imagen, es mejor abstenerse de utilizar esta palabra.

Negative prompt

Stable Diffusion XL también utiliza un negative prompt, que le permite introducir palabras clave que no desea que aparezcan en su imagen.

Como queremos una foto, utilizaremos palabras clave negativas para indicar los otros tipos de imagen que no queremos:

ilustración, dibujos animados, anime, render 3d, pintura, crayón, boceto, grafito, impresionista, unreal engine

Intentemos esta pregunta negativa, manteniendo las preguntas anteriores y sus seed:

👉

Para más información sobre este tema, consulte nuestro artículo sobre Prompt negativo en Difusión Estable.

Palabras clave de fotos

Podemos ir un paso más allá añadiendo una o varias palabras clave utilizadas para describir las fotos, que guiarán a Stable Diffusion XL aún más hacia una representación fotográfica, al tiempo que definen la imagen y el resultado final con mayor precisión.

Para todas las palabras clave que figuran a continuación, hemos utilizado los mismos prompt y seed, añadiendo sólo una palabra clave - esto le permite ver hasta qué punto influye (o no) en la foto y su realismo.

La iluminación es un elemento clave en la fotografía y los fotógrafos han aprendido a dominarla desde hace mucho tiempo. A menudo es la calidad de la iluminación lo que hace que una foto sea buena. Stable Diffusion reconoce muchos tipos de iluminación que puedes utilizar en tus prompts: inspírate directamente de estos consjejos para los fotógrafos para encontrar iluminación que utilizar en tus prompts.

Algunas cámaras, ya sean modernas o antiguas, tienen un estilo propio, y el uso de estas cámaras como palabras clave puede influir en la forma en que Stable Diffusion XL crea sus imágenes, aportando tanto estilo como realismo a tus fotos de IA

el tipo de película fotográfica o las técnicas de procesado influirán de forma interesante en los resultados, al igual que la antigüedad de la foto y los elementos que la componen

También puedes cambiar la imagen obtenida indicando la distancia focal. Como este parámetro depende muy a menudo del tipo de foto que el fotógrafo quiera obtener, influirá fácilmente en varios aspectos de la imagen, como su composición, la pose del modelo, la iluminación,…

Incluso para los retratos, hay distintas opciones de encuadre: desde el primer plano (close-up) al cuerpo entero (full body) y hasta la cintura (down to the waist).

Por último, si sabes algo de fotografía, no dudes en probar y utilizar otras palabras clave del mundo de la fotografía: enfoque, profundidad de campo, diafragma, exposición, balance de blancos, etc.

Otras palabras clave

Además del vocabulario y las palabras clave específicas de la fotografía, otras palabras clave pueden mejorar la calidad de las imágenes generadas y darles un aspecto aún más realista. He aquí algunas de ellas.

El aspecto y la textura de la piel es un detalle que a menudo delata a las imágenes artificiales (IA o 3D). Para superarlo, se pueden utilizar (e incluso combinar) varias palabras clave para mejorar este aspecto en tus fotos: kin pores, highly detailed skin, skin details. Mencionar algunos defectos también puede evitar que se genere una piel demasiado perfecta para ser real: skin blemished, freckles, wrinkles…

El indicador también puede utilizarse para dirigir la mirada del sujeto: ¿debe mirar hacia la cámara o a lo lejos?

Mencionar el nombre de un fotógrafo, un estudio o un estilo fotográfico también puede realzar el aspecto y el realismo de tu foto

También puedes añadir detalles a tus fotos especificándolos en tu pregunta. Los fotógrafos suelen utilizar atrezzo, es decir, objetos o elementos físicos que se añaden a un escenario para conseguir un efecto estilístico o emocional. Y aquí, ¡tu imaginación es tu único límite!

Ejemplos de indicaciones completas

Combinando varios de estos elementos y conceptos, podemos componer prompts completos capaces de generar retratos fotográficos realistas con Stable Diffusion XL. He aquí algunos ejemplos:

Photo of a an african-american man in new york, head and shoulders portrait shot with Fujifilm Superia, candid street photography

close up portrait of female barista, detailed photograph shot on kodak, amazing skin details

Portrait of a japanese yoga teacher, Instagram photography, traditional Japanese style room, eyes closed

photo of beautiful man smiling, freckles, looking away, shot with Nikon D750, soft light and pastel colors, magazine cover

Modelos fotorrealistas

Uno de los puntos fuertes de Stable Diffusion es la posibilidad de entrenar y crear modelos que cambien la forma en que genera las imágenes. Ya en la versión 1.5, utilizaronciertos checkpoints o LoRA para mejorar el fotorrealismo de las imágenes. Este es obviamente el caso de SDXL, para el que se han creado varios modelos con el fin de producir fotos aún más realistas

Veamos algunos de estos modelos y cómo pueden utilizarse para crear fotos.

RealVisXL

Este modelo es, de hecho, una fusión de varios otros modelos fotorrealistas SDXL, una forma de intentar combinar lo mejor de varios modelos interesantes.

Oficialmente aún en fase de pruebas y creación, RealVisXL ya ofrece excelentes resultados y funciona muy bien para crear fotos realistas. Una de sus ventajas es que genera rostros menos "perfectos", lo que evita generar retratos con un aspecto excesivamente de revista o supermodelo.

Su creador recomienda utilizar un prompt negativo como el que se muestra a continuación y utilizar el muestreador Karras DPM++ SDE con 30 steps.

(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth

Utilizando estos parámetros e indicaciones como las desarrolladas anteriormente en este artículo, obtendrá unos resultados sorprendentes.

Portrait photo of a 25 years old american man in crowded pub, looking at the viewer, natural skin, shot with an iPhone

front shot portrait photo of an happy 42 years old woman, looks away, natural skin, skin moles, glamour interior, shot on Kodac film

Close up portrait of a young japanese yoga teacher in sportswear, Natural lighting, Instagram photography, eyes closed, detailed skin

photograph close up portrait of a cowboy holding a gun, shot on kodak 80mm, Short Exposure, sunlight

Realistic Stock Photo

Este punto de control combina la fusión de otros modelos con un entrenamiento específico a partir de fotos de bancos de imágenes. El resultado es un modelo bastante eficaz, sobre todo para retratos en primer plano de personas "normales".

El autor recomienda reducir la escala del cfg a 3 para los cierres. Yo también he reducido el número de steps para algunas pruebas, sin notar mucha diferencia. Sin embargo, ni siquiera los ejemplos de Civitai utilizan siempre el Prompt Negativo, así que he mantenido mi prompt negativo, más por costumbre que por otra cosa

Close up portrait of male boxer, serious look, red gloves, dynamic pose

front shot, portrait photo of an american woman, looks away, natural skin, skin moles, cozy interior, film grain

photograph full body portrait of a cyberpunk hacker, Short Exposure, neon light, looking at the viewer, shot from below

Copax TimeLessXL

TimeLessXL es un modelo muy completo, entrenado para generar no sólo imágenes realistas, sino también en una gran variedad de estilos y géneros.

El autor recomienda utilizar el siguiente indicador negativo, que utilizaremos para nuestras pruebas.

(worst quality, low quality, illustration, 3d, 2d), open mouth, tooth,ugly face, old face, long neck,

Full body shot of a fitness trainer, well - developed muscles, beautiful body, athletic legs and hips, sportwear, shot on Kodac film

Realities Edge XL

Este modelo promete nada menos que el mejor fotorrealismo SDXL, mejorando la falta de detalle y textura del modelo base, corrigiendo los defectos anatómicos que SDXL suele pasar por alto y ofreciendo una mayor variedad étnica.

Personalmente, no estoy seguro de que los retratos en primer plano tengan mejores texturas que otros modelos.

Aunque el autor recomienda DPM+ 3M SDE Karras, mis pruebas con otros samplers también son buenas.

full body shot of an old fisherman sea captain, kodachrome, natural lighting, sunny day, fishing boat

photo of a futuristic car pilot, minimalist photographic portrait, sleek and minimal design, smooth metal

photography, a woman with a flower in her hair, cyberpunk style, tattoo, head and shoulder portrait, highly detailed digital photography

Fotos realistas con SDXL

Como hemos visto, ahora es posible crear retratos fotorrealistas de una calidad impresionante. Estos avances no sustituyen a la fotografía real, pero ofrecen una nueva gama de herramientas para quienes buscan innovar, experimentar o incluso llenar lagunas en sus proyectos.

Aunque la elección del motivo y el modelo son fundamentales para obtener buenos resultados, lo que marcará la verdadera diferencia y hará que tus imágenes sean únicas es cómo piensas en tus imágenes, en sus sujetos y en sus composiciones antes de utilizar estas técnicas para crearlas. Stable Diffusion XL puede, en efecto, generar la foto por ti, pero no puede imaginarla por ti.

Fotografías realistas