Un avance reciente en la inteligencia artificial (IA) generativa está cambiando el juego en la edición de imágenes. DragGAN, una innovación del MIT y la Universidad de Pensilvania en colaboración con Google, está llevando la edición de imágenes a un nivel completamente nuevo. Esta plataforma es una versión avanzada de la herramienta Warp (Deformar) que se encuentra en Photoshop, pero con capacidades mucho más amplias, tal y como vamos a ver a continuación.
DragGAN no solo permite deformar imágenes a tu voluntad, sino que también puede crear una versión completamente nueva de cualquier objeto visible en la imagen. Los desarrolladores han demostrado sus capacidades a través de una serie de videos en el sitio web del proyecto. Por ejemplo, DragGAN puede modificar la imagen de un león acostado con la boca cerrada para que parezca que el animal está bostezando.
Además, DragGAN puede cambiar la expresión de una persona en un retrato con solo agregar dos puntos de referencia, o incluso modificar la iluminación de la escena para adaptarse a la posición del sol que elija el usuario.
Lo que hace que DragGAN sea realmente interesante es la tecnología que impulsa la herramienta y las características que ofrece su interfaz. DragGAN funciona con el respaldo de una red generativa antagónica, también conocida como GAN. Las GAN se caracterizan por enfrentar dos redes neuronales en una 'competencia suma cero', es decir, la pérdida o ganancia de una de las redes se compensa con la pérdida o ganancia de la otra.
En este sistema, tenemos una red generativa que se centra en crear todo tipo de contenido en función de las solicitudes del usuario. Esta red se complementa con una segunda red discriminadora que está entrenada para identificar y analizar el material producido por la red generativa para determinar si el resultado entregado es el mejor en función de los datos de aprendizaje y la solicitud del usuario.
Las GAN no son nada nuevo y se pueden encontrar en generadores de imágenes sofisticados que son capaces de generar imágenes tan realistas que logran engañar a millones de personas. Sin embargo, el gran aporte de DragGAN es su interfaz que hace que esta tecnología sea mucho más accesible y fácil de usar para obtener una imagen exacta creada con IA con todo tipo de detalle.
En términos técnicos, DragGAN no solo difumina, elimina o tritura los píxeles existentes, sino que es capaz de crear un elemento totalmente nuevo a partir de la misma información.
En la práctica, esta herramienta puede ser un complemento valioso para sistemas como DALL-E 2, Stable Diffusion o Midjourney que son capaces de generar imágenes cada vez más realistas, pero que con DragGAN podrían afinar el contenido para entregar a los usuarios una imagen a medida con un gran nivel de detalle.
Aquí tienes algunos ejemplos de lo que puedes hacer con DragGAN:
Si estás buscando una manera de hacer ediciones rápidas y fáciles a tus imágenes, entonces vale la pena revisar DragGAN AI editor de fotos.
Estos son algunos de los beneficios de usar DragGAN:
Estas son algunas de las limitaciones de DragGAN:
DragGAN es una herramienta open source y su código será liberado en los próximos meses. A día de hoy lo único que hay disponible es una demo con varios videos que podemos consultar desde la web oficial del proyecto.
Una vez sea liberado, el código fuente estará disponible desde el repositorio que ya han habilitado para tal efecto en GitHub.
Si este software de Inteligencia Artificial destierra a Photoshop o no, al menos habrá que esperar un tiempo para comprobarlo. Lo que sí está claro es que la manipulación de fotografías va a ser mucho más sencilla a partir de ahora, sin necesidad de tener altos conocimientos técnicos para conseguir resultados simplemente increíbles.
Además, es de esperar que otras aplicaciones tales como Photoshop, GIMP o Krita implementen un plugin para DraGAN. O quizás podrían desarrollar su propio sistema de manipulación interactiva basada en puntos (no olvidemos que DragGAN es de código abierto).
Todos hemos estado allí: tienes 20 pestañas abiertas, cinco PDFs y tres hojas de cálculo,…
Si ya estás usando Google Nano Banana, sabes que es la herramienta que está redefiniendo…
¿Te ha pasado? Estás en plena conversación con Gemini, fluyendo con ideas, y de repente……
¿Alguna vez soñaste con ser una de esas figuras coleccionables que tanto te fascinaban de…
Imagina caminar por las calles iluminadas de París al atardecer, con la Torre Eiffel brillando…
¿Imaginas crear aplicaciones inteligentes que resuelvan tus problemas cotidianos sin escribir una sola línea de…
Esta página utiliza cookies para mejorar su rendimiento