El nuevo editor de fotos de Gemini es una locura y puede convertirte en lo que siempre soñaste

El nuevo editor de fotos de Gemini es una locura y puede convertirte en lo que siempre soñaste

La edición de fotos a través de la app de Gemini acaba de dar un salto impactante, con la implementación de un nuevo modelo nativo. A partir de ahora, Google te permite transformar tus imágenes (o las de personas que conoces) para adaptarlas a nuevos escenarios y posibilidades, todo de forma rápida y con resultados sorprendentemente buenos.

El modelo en cuestión se llama Gemini 2.5 Flash Image y se encuentra disponible desde hoy mismo a través de varias plataformas. La de más fácil acceso es la app de Gemini, pero también es accesible mediante herramientas para desarrolladores como Vertex, Google AI Studio y la API de Gemini.

Lo más interesante del nuevo editor de fotos nativo de Gemini es que puede convertirte en lo que siempre soñaste, respetando tu apariencia y sin grandes distorsiones. Esto significa que puedes tomarte una selfie y pedirle a través de un prompt de texto que te ubique en un escenario diferente, que te imagine practicando otra actividad, o incluso que te aplique un look de otra época sin que pierdas tus rasgos faciales.

Para ponerlo a prueba, me tomé una foto de frente y le pedí a Gemini que me convirtiera en un futbolista, y respetó la instrucción de gran forma. Resulta sorprendente cómo la inteligencia artificial puede modificar la orientación del rostro para acoplarla en la imagen. Y hasta respetó el formato de mis gafas, lo cual no es un detalle menor (más allá de que podemos discutir si se ajustan o no al contexto deportivo).

Gemini Flash 2.5 Image es la nueva IA insignia para editar fotos
Las habilidades para jugar al fútbol no están incluidas en el modelo de IA 😉

Gemini Flash 2.5 Image es la nueva IA insignia para editar fotos

Pero el nuevo editor de fotos de Gemini no solo puede convertirte en futbolista, torero o estrella de una sitcom de los noventa. El modelo que ha desarrollado Google DeepMind también puede combinar dos fotos diferentes para crear una nueva respetando la apariencia de sus protagonistas.

En uno de los ejemplos que ha compartido la compañía se observa cómo la IA puede unir a una joven y a su mascota en una nueva escena, sin distorsionar cómo se ven. Y la tecnología también soporte la edición en múltiples pasos, de modo que puedes pedirle que siga aplicando modificaciones sobre la misma imagen, sin necesidad de que la cree otra vez desde cero.

Vale decir que las bondades de Gemini Flash 2.5 Image no se limitan a trabajar con fotos de personas reales. También es posible hacer otros tipos de ediciones, como, por ejemplo, tomar la foto de una habitación vacía y pedirle que cambie el color de las paredes, que añada muebles, alfombras y otros elementos para componer el entorno. Asimismo, se pueden mezclar diferentes diseños ya existentes para crear imágenes realistas, como adaptar el patrón estético de las alas de una mariposa en un vestido.

La nueva IA de Google se ha convertido en el modelo de edición de imágenes con mejor calificación del mundo, superando a flux-1 (la tecnología que Grok usaba originalmente), GPT-Image y Qwen, entre otros modelos.

Por supuesto que lo nuevo Gemini despierta algunas inquietudes debido a que permite editar fotos de personas reales. Esto puede ser un problema para la creación de deepfakes, aunque desde Google le manifestaron a TechCrunch que han establecido salvaguardias para evitar abusos. En el anuncio oficial, la empresa habla de modificar fotos propias de los usuarios o de individuos que “conozcan bien”. Ya veremos cómo sigue todo.


Fuente original

Comments

No comments yet. Why don’t you start the discussion?

Deja un comentario