Hay muchos modelos de IA generativa capaces de crear imágenes mediante una breve descripción de texto. Y Google, quien durante los últimos meses ha estado trabajando en mejorar sus productos de inteligencia artificial, por supuesto, también tiene el suyo. Se trata de Imagen 3, y si bien no es una herramienta nueva, recientemente se ha actualizado con diferentes novedades, entre las que se incluye su uso a través de Gemini, el modelo de lenguaje de la compañía que compite contra ChatGPT.
De hecho, Google lleva utilizando Imagen 3 en Android durante un tiempo, permitiendo a los usuarios de sus móviles, los Google Pixel, crear fondos de pantalla únicos mediante diferentes prompts o descripciones. Ahora, además, Imagen 3 está disponible en todos los idiomas en los que está disponible Gemini (incluido el español) y se puede usar de forma gratuita a través del mencionado Chatbot. Pero, ¿en qué consiste realmente esta IA?
¿Cómo funciona Imagen 3?
Imagen 3, reiteramos, es un modelo de inteligencia artificial capaz de generar imágenes o diseños fotorrealistas mediante una breve descripción de texto. Es posible pedirle prácticamente cualquier cosa, por muy rejos que esté de la realidad. Por ejemplo, podemos pedirle que genere una imagen de un pájaro subido en un coche que orbita por el espacio, o una de un árbol cuyas hojas tengan forma de corazones, etc.
La IA de Google, además, permite a los usuarios tener el control de lo que crea. Si por cualquier motivo a la persona no le convence el diseño que Imagen 3 ha creado, puede modificarlo pidiendo que cambie cualquier elemento —por ejemplo, que el coche sea de un color diferente, que las hojas con forma de corazón sean de otro color, etc.— el modelo de inteligencia artificial generativa de la compañía realizará los cambios.
Google, por otro lado, está mejorando Imagen 3 con una función adicional que permite generar imágenes de personas reales —hasta ahora, el modelo no incluía esta opción—. La compañía asegura que esto supone un avance significativo frente a otros modelos, aunque, eso sí, tiene una serie de limitaciones. En primer lugar, Google no permite crear imágenes de personas identificables, como celebridades o cualquier otro personaje famoso. Tampoco de menores. Por supuesto, la IA de Google tampoco permite generar diseños con escenas excesivamente sangrientas, violentas o sexuales.
Google también tiene en cuenta el peligro que puede suponer crear imágenes mediante inteligencia artificial generativa, pues muchos pueden usar este tipo de diseños para fines poco éticos, como, por ejemplo, hacer ver que la imagen generada por IA parezca una imagen real con el objetivo de engañar a la gente. En este caso, y para evitar este tipo de problemas, todos los diseños de Imagen 3 cuentan con una marca de agua invisible para el ojo humano, pero detectable para aquellas herramientas destinadas a la identificación de materiales creados por inteligencia artificial.
Cómo crear diseños con la IA de Google a través de Gemini
Imagen 3, reiteramos, llegará en los próximos días a Gemini, el chatbot de la compañía disponible tanto en versión web, como mediante una app. Gemini también está disponible a través de algunos móviles Android, como los Google Pixel. Incluso, está disponible en la versión gratuita. Esto hace que usar el modelo de generación de imágenes sea mucho más sencillo. Te explicamos a continuación cómo hacerlo paso a paso.
Para generar un diseño con Imagen 3, basta con acceder a gemini.com y pedirle, en el cuadro de texto, que cree una imagen seguida de una descripción de la misma. Por ejemplo, “crea una imagen de un pastor alemán en bicicleta”. También es posible pedirle diferentes estilos. Por ejemplo, que la imagen sea realista, que tenga textura de pintura al óleo, o que cuente con un diseño más animado.
Una vez que Imagen 3 haya generado el diseño, podemos pedirle que realice algunos cambios en el mismo si es necesario. Por ejemplo, que modifique el tamaño de la bicicleta, que el perro esté de pie sobre ella, etc.
Para crear diseños en los que aparezcan personas, será necesario contar con Gemini Advance, el servicio de suscripción del chatbot de Google que tiene un precio de 21,99 euros al mes. Además, es necesario tener configurado Gemini en inglés. Por último, solo tienes que pedir que produzca un diseño y describir el aspecto de la persona. Imagen 3 generará la imagen en tan solo unos segundos.