Un avance reciente en la inteligencia artificial (IA) generativa está cambiando el juego en la edición de imágenes. DragGAN, una innovación del MIT y la Universidad de Pensilvania en colaboración con Google, está llevando la edición de imágenes a un nivel completamente nuevo. Esta plataforma es una versión avanzada de la herramienta Warp (Deformar) que se encuentra en Photoshop, pero con capacidades mucho más amplias, tal y como vamos a ver a continuación.
DragGAN no solo permite deformar imágenes a tu voluntad, sino que también puede crear una versión completamente nueva de cualquier objeto visible en la imagen. Los desarrolladores han demostrado sus capacidades a través de una serie de videos en el sitio web del proyecto. Por ejemplo, DragGAN puede modificar la imagen de un león acostado con la boca cerrada para que parezca que el animal está bostezando.
Además, DragGAN puede cambiar la expresión de una persona en un retrato con solo agregar dos puntos de referencia, o incluso modificar la iluminación de la escena para adaptarse a la posición del sol que elija el usuario.
Lo que hace que DragGAN sea realmente interesante es la tecnología que impulsa la herramienta y las características que ofrece su interfaz. DragGAN funciona con el respaldo de una red generativa antagónica, también conocida como GAN. Las GAN se caracterizan por enfrentar dos redes neuronales en una 'competencia suma cero', es decir, la pérdida o ganancia de una de las redes se compensa con la pérdida o ganancia de la otra.
En este sistema, tenemos una red generativa que se centra en crear todo tipo de contenido en función de las solicitudes del usuario. Esta red se complementa con una segunda red discriminadora que está entrenada para identificar y analizar el material producido por la red generativa para determinar si el resultado entregado es el mejor en función de los datos de aprendizaje y la solicitud del usuario.
Las GAN no son nada nuevo y se pueden encontrar en generadores de imágenes sofisticados que son capaces de generar imágenes tan realistas que logran engañar a millones de personas. Sin embargo, el gran aporte de DragGAN es su interfaz que hace que esta tecnología sea mucho más accesible y fácil de usar para obtener una imagen exacta creada con IA con todo tipo de detalle.
En términos técnicos, DragGAN no solo difumina, elimina o tritura los píxeles existentes, sino que es capaz de crear un elemento totalmente nuevo a partir de la misma información.
En la práctica, esta herramienta puede ser un complemento valioso para sistemas como DALL-E 2, Stable Diffusion o Midjourney que son capaces de generar imágenes cada vez más realistas, pero que con DragGAN podrían afinar el contenido para entregar a los usuarios una imagen a medida con un gran nivel de detalle.
Aquí tienes algunos ejemplos de lo que puedes hacer con DragGAN:
Si estás buscando una manera de hacer ediciones rápidas y fáciles a tus imágenes, entonces vale la pena revisar DragGAN AI editor de fotos.
Estos son algunos de los beneficios de usar DragGAN:
Estas son algunas de las limitaciones de DragGAN:
DragGAN es una herramienta open source y su código será liberado en los próximos meses. A día de hoy lo único que hay disponible es una demo con varios videos que podemos consultar desde la web oficial del proyecto.
Una vez sea liberado, el código fuente estará disponible desde el repositorio que ya han habilitado para tal efecto en GitHub.
Si este software de Inteligencia Artificial destierra a Photoshop o no, al menos habrá que esperar un tiempo para comprobarlo. Lo que sí está claro es que la manipulación de fotografías va a ser mucho más sencilla a partir de ahora, sin necesidad de tener altos conocimientos técnicos para conseguir resultados simplemente increíbles.
Además, es de esperar que otras aplicaciones tales como Photoshop, GIMP o Krita implementen un plugin para DraGAN. O quizás podrían desarrollar su propio sistema de manipulación interactiva basada en puntos (no olvidemos que DragGAN es de código abierto).
¿Quieres poner texto detrás de un video? Aprende cómo con CapCut en este sencillo tutorial…
Aprende a crear voces con IA sorprendentemente reales para vídeos, podcasts y más. Lee nuestro…
TikTok se reinventa con TikTok Notes: una app de fotos y estilo de vida. Conoce…
¡Descubre Haiper! La alternativa gratuita a Sora de OpenAI para crear vídeos increíbles. Fácil de…
¿Buscas una alternativa a ChatGPT? Mistral AI y su chatbot Le Chat ofrecen una experiencia…
Más que un resumen: Adobe AI Assistant te ayuda a navegar y comprender PDFs con…
Esta página utiliza cookies para mejorar su rendimiento