Si deseas utilizar la composición, la pose de un personaje o el estilo de textura de una imagen de referencia en tu proceso de generación, las funciones de imagen a imagen y Vary Region (Región Variable) de Midjourney son herramientas muy prácticas. A continuación, te explicamos los pasos en orden: primero usar la imagen de referencia para definir la dirección, y luego retocar los detalles con la función de repintado local, para que puedas avanzar de manera eficiente.
Cómo comenzar con Imagen a Imagen: Sube una imagen y úsala como referencia
En la versión web de Midjourney, dirígete a "Create". Primero, arrastra tu imagen de referencia al cuadro de texto o haz clic para subirla, de modo que aparezca en el área del prompt (indicación). Confirma que la miniatura de la imagen se ha agregado correctamente y luego complementa con una descripción textual, por ejemplo, el sujeto principal, la escena, el tipo de encuadre y el estilo. Esto ayuda a Midjourney a entender "qué usar como referencia y qué generar".
Si deseas que el resultado sea más "similar a la imagen de referencia", puedes agregar el parámetro "--iw 1.5" a "--iw 2" al final de tu prompt (un valor más alto otorga mayor peso a la referencia). Por el contrario, si quieres conservar la inspiración pero no una similitud excesiva, reduce el valor de "--iw" y utiliza un texto más específico para guiar los detalles.
Cómo escribir el prompt para Imagen a Imagen: Puntos clave para fijar la composición y el estilo
El problema más común al usar una imagen de referencia es obtener un resultado "similar pero incorrecto". Suele ocurrir cuando solo se usan palabras de ambiente, sin aclarar la composición y la relación entre los elementos. Se recomienda escribir en este orden: Sujeto principal (quién/qué) + Pose/acción + Elementos del entorno + Iluminación (luz suave/luz lateral contraluz) + Textura/material (cuero/metal/grano de película) + Estilo visual (realista/ilustración/fotografía).
En Midjourney, las palabras negativas también son importantes. Por ejemplo, añadir "no text, no watermark, no extra fingers" ayuda a reducir imperfecciones comunes. Si las figuras humanas se distorsionan, intenta eliminar la mitad de los "adjetivos elaborados" de tu prompt, manteniendo solo la información estructural más crucial; los resultados suelen ser más consistentes.


