He creado estas imágenes solo con la voz y la nueva función de Gemini. Estoy impresionado con los resultados

He creado estas imágenes solo con la voz y la nueva función de Gemini. Estoy impresionado con los resultados

Google acaba de implementar el motor de creación de imágenes Imagen 3 en Gemini, abriendo las puertas a que cualquier usuario de esta inteligencia artificial pueda crear imágenes. Esta IA se puede usar en la web, pero su potencial en móviles me parece algo bastante salvaje. En mi caso, tengo Gemini como remplazo a Google Assistant, por lo que me basta con pulsar el botón de encendido para activarla.

Al abrir Gemini directamente, puedo darle instrucciones con la voz, y no necesito escribir el prompt. Darle a un botón y decirle que «genere una imagen de un Mercedes SLR McLaren en un circuito de velocidad» y que la cree a la perfección es algo que no esperaba.

Imagen 3 es la nueva versión del modelo de inteligencia artificial que, a partir de ahora, utilizará Gemini para generar imágenes. Es la versión más reciente y, según Google, ha mejorado estos tres pilares respecto a versiones anteriores:

  • Las imágenes tienen mucho más detalle y menos imperfecciones.
  • Las imágenes son mucho más realistas que antes.
  • Ahora es posible generar imágenes con muchos más estilos.

{«videoId»:»x937w44″,»autoplay»:false,»title»:»El nuevo modo de voz de ChatGPT», «tag»:»tecnología», «duration»:»15″}

Usar Imagen 3 en Gemini es más que sencillo. Solo tienes que descargar la app de Gemini desde Play Store, y generar el prompt. Puede ser escrito, pero hacerlo con voz es mucho más cómodo.

Coches

Como buen amante de los coches, le he pedido a Gemini que genere una imagen de un Mercedes SLR McLaren en un circuito de velocidad. He escogido este modelo por ser bastante particular a nivel de diseño y, para mi sorpresa, lo ha recreado -casi- a la perfección. Se sigue notando que es una imagen generada por IA, pero para ser una foto creada en cinco segundos con mi voz, ni tan mal.

Perro y gato

En la segunda imagen, he creado algo más sencillo, un perro y un gato caminando juntos. El bokeh que ha creado es sencillamente espectacular y, a nivel de nitidez, la imagen es brutal.

Imagen

Para complicarle un poco y ver cómo interpreta los estilos, le he pedido una calle de una calle de Nueva York, con luces de fondo y al estilo CyberPunk. El resultado, de nuevo, es sorprendente.

iAMc

Como fin de fiestas, le he pedido la imagen de un iMac, en un escritorio, y en cuyo fondo de pantalla aparece la palabra ‘Xataka’. La generación de texto es todo un problema para muchas IAs gratuitas. No es el caso de Imagen 3. Tampoco tiene problemas para generar logos de marcas, aunque aquí no es tan fino.

Imagen | Xataka

En Xataka | 19 páginas y servicios para crear imágenes desde cero utilizando inteligencia artificial

(function() {
window._JS_MODULES = window._JS_MODULES || {};
var headElement = document.getElementsByTagName(‘head’)[0];
if (_JS_MODULES.instagram) {
var instagramScript = document.createElement(‘script’);
instagramScript.src = ‘https://platform.instagram.com/en_US/embeds.js’;
instagramScript.async = true;
instagramScript.defer = true;
headElement.appendChild(instagramScript);
}
})();


La noticia

He creado estas imágenes solo con la voz y la nueva función de Gemini. Estoy impresionado con los resultados

fue publicada originalmente en

Xataka

por
Ricardo Aguilar

.

Source: Xataka

Related posts