Google revela seis trucos para construir buenos prompts al momento de generar imágenes con IA

Es fundamental que los usuarios indiquen quién o qué aparecerá en la imagen. Ser específico permite que la inteligencia artificial genere con mayor precisión el resultado que deseas

Guardar
Al crear una imagen con
Al crear una imagen con inteligencia artificial, es fundamental dar una instrucción o prompt claro y preciso. REUTERS/Dado Ruvic/Illustration/File Photo

Al generar una imagen con inteligencia artificial, uno de los aspectos más importantes es proporcionar una buena instrucción o prompt, ya que esto determina la calidad y precisión del resultado. Por ello, Google ha compartido seis trucos para lograr las mejores imágenes posibles.

Es importante recordar que un prompt es cualquier indicación que se le da a una herramienta de inteligencia artificial —como Gemini, ChatGPT, Copilot, Grok o Meta AI— para guiarla en la creación del contenido que deseas.

Estos consejos para elaborar prompts
Estos consejos para elaborar prompts son especialmente útiles para Gemini. REUTERS/Dado Ruvic/Illustration/File Photo

Qué consejos recomienda Google para generar una imagen con IA

Google sugiere seguir estos consejos al crear un prompt para que la inteligencia artificial genere una imagen:

  • Asunto: Define quién o qué aparecerá en la imagen. Ser específico ayuda a que la IA genere exactamente lo que deseas. Ejemplo: “Un robot barista estoico con ojos azules brillantes” o “Un gato calicó con un pequeño sombrero de mago”.
  • Composición: Indica cómo quieres que se encuadre la imagen o desde qué perspectiva se vea. Esto determina la forma en que se presenta el sujeto o la escena. Puedes utilizar términos como “primerísimo plano”, “plano general”, “ángulo bajo” o “retrato”.
  • Acción: Describe lo que está haciendo el sujeto o los elementos de la imagen. Esto ayuda a que la escena sea dinámica y coherente. “Preparando una taza de café”, “lanzando un hechizo mágico” o “corriendo a media zancada por un campo”, son ejemplos de acciones que pueden agregar a tu prompt.
Entre más específico sea el
Entre más específico sea el prompt, mejor será la imagen generada. (Google)
  • Ubicación: Explica dónde ocurre la escena para darle contexto y ambiente a la imagen. Ejemplo: “Un café futurista en Marte”, “la biblioteca de un alquimista desordenada” o “una pradera al atardecer”.
  • Estilo: Define la estética o el tipo de representación visual que deseas, como si fuera una guía para el acabado artístico. Puedes solicitar que tenga un estilo de animación 3D, cine negro o acuarela.
  • Instrucciones de edición: Si quieres modificar una imagen existente, sé directo y preciso con los cambios que deseas realizar. Por ejemplo: “Cambiar la corbata del hombre a verde” o “quitar el automóvil del fondo”.
Los usuarios pueden agregar el
Los usuarios pueden agregar el estilo que deseen para la foto en su prompt. (Google)

Por ello, un ejemplo de prompt ideal sería el siguiente:

“Un gato calicó con un pequeño sombrero de mago, primerísimo plano, lanzando un hechizo mágico en la biblioteca de un alquimista desordenada, estilo acuarela, con iluminación cálida y detalles nítidos.”

Este prompt combina asunto, composición, acción, ubicación y estilo, lo que ayuda a que la IA genere una imagen precisa y coherente.

Cuáles son las nuevas herramientas de edición de fotos en Gemini

Google ha agregado nuevas herramientas de edición de fotos a Gemini como:

  • Fusionar fotos.

Ahora puedes subir varias fotos y fusionarlas para crear una escena completamente nueva. Por ejemplo, toma tu foto y otra de tu perro para crear un retrato perfecto de ambos en la cancha de baloncesto.

Ahora tienes la opción de
Ahora tienes la opción de subir varias fotos y combinarlas para generar una escena totalmente nueva. (Google)
  • Dar cambios de vestuario o de ubicación.

Sube la foto de una persona o mascota, y nuestro modelo conservará sus rasgos al integrarla en distintos escenarios. Puedes probar con diferentes atuendos, profesiones o imaginar cómo lucirías en otra época.

  • Edición multi-turno.

Con Gemini, puedes seguir ajustando y personalizando las imágenes que genera. Por ejemplo, puedes empezar con una habitación vacía, cambiar el color de las paredes y luego agregar elementos como una estantería, muebles o una mesa de centro.

La ventaja de Gemini es que te permite modificar áreas específicas de la imagen sin alterar el resto del diseño.

  • Combinar diseños.

Transfiere el estilo de una imagen a otro objeto. Por ejemplo, puedes usar el color y la textura de los pétalos de una flor para unas botas de lluvia o crear un vestido con el diseño de las alas de una mariposa.