¿Manipular una foto para que tu suegro aparezca con los ojos abiertos, tu perro mire a cámara o ese montecillo al que fuiste de excursión parezca un primo del Everest? Bueno, eso ya es posible gracias a Adobe Photoshop y el resto de editores fotográficos del mercado.
Pero, claro, las herramientas que dicho software proporciona requieren una gran habilidad (y paciencia) para controlar con precisión la posición / forma / expresión / disposición de los elementos de la foto.
No es muy diferente a querer retocar ilustraciones a fuerza de pincelada: artesanal, pero una opción poco factible para la mayoría de los usuarios.
Sin embargo, estamos en la era de la inteligencia artificial y un grupo de investigadores de inteligencia artificial ha hecho pública la existencia de una herramienta llamada DragCAN, en la que, mediante la manipulación generativa de imágenes, es capaz de proporcionar una alternativa a esa mayoría de usuarios.
«Con DragGAN, cualquiera puede deformar una imagen y tener un control preciso sobre dónde termina cada píxel».
Pero, claro, las herramientas que dicho software proporciona requieren una gran habilidad (y paciencia) para controlar con precisión la posición / forma / expresión / disposición de los elementos de la foto.
No es muy diferente a querer retocar ilustraciones a fuerza de pincelada: artesanal, pero una opción poco factible para la mayoría de los usuarios.
Sin embargo, estamos en la era de la inteligencia artificial y un grupo de investigadores de inteligencia artificial ha hecho pública la existencia de una herramienta llamada DragCAN, en la que, mediante la manipulación generativa de imágenes, es capaz de proporcionar una alternativa a esa mayoría de usuarios.
«Con DragGAN, cualquiera puede deformar una imagen y tener un control preciso sobre dónde termina cada píxel».
DragGAN abre una categoría completamente nueva en el campo de la edición de imágenes, donde el usuario es capaz de personalizar imágenes fotorrealistas (ya sean fotos de verdad, ya sean imágenes creadas por otras IAs generativas)…
…a través de un mecanismo interactivo tan simple como es el de arrastrar y soltar; olvidémonos de los prompts de texto. En realidad, a efectos prácticos, se parece bastante a editar las fotos como si fueran modelos en 3D.
La clave de DragCAN es que, siempre y cuando haya sido entrenada en la clase de elemento de la imagen que estamos tratando de editar, la IA es capaz de aportar la información faltante en la imagen original: vamos, que podemos decirle que le abra la boca a un león, y será la herramienta la que se encargue de crear los colmillos y la lengua, por ejemplo.
En las imágenes de prueba publicadas por sus creadores, se observa que DragGAN permite realizar estas tareas indicando únicamente puntos de origen y de destino, con los cuales reconoce cuándo mover algo (como la cabeza de un león) y cuándo alterar su forma (como el largo de las mangas de una camiseta).
Según sus creadores, sólo sería necesario contar con una tarjeta como la NVIDIA RTX 3090 (en torno a 2.500 €) para realizar las tareas antes descritas en pocos segundos. Aunque, por desgracia, el software aún no está disponible para el público general.