Tecnologías

¡De dibujos a fotos! Esta inteligencia artificial hace el trabajo por ti

Nvidia desarrolló GauGAN 2, una tecnología que permite convertir dibujos y textos en imágenes realistas.

14-01-2022 16:04 Por : Arena Pública
GauGAN 2 es capaz de realizar imágenes a partir de dibujos muy sencillos.
GauGAN 2 es capaz de realizar imágenes a partir de dibujos muy sencillos.

No dudes más de tus habilidades artísticas y convierte tus dibujos en impresionantes fotografías.

La compañía de tecnología Nvidia, ha invertido en esta inteligencia artificial (I.A.) durante los últimos dos años, teniendo como resultado el desarrollo de GauGAN 2, una herramienta que permite convertir dibujos y textos en imágenes realistas.

La I.A. es parte del programa NVIDIA Research, el cual cuenta con más de 200 científicos en todo el mundo, enfocados en áreas que incluyen IA, visión por computadora, autos autónomos, robótica y gráficos.

De acuerdo con la compañía, el modelo de IA detrás de GauGAN2 se entrenó con más de 10 millones de imágenes de paisajes de alta calidad utilizando NVIDIA Selene, un sistema NVIDIA DGX SuperPOD que se encuentra entre las 10 supercomputadoras más poderosas del mundo.

Los investigadores emplearon una red neuronal que aprende la conexión entre las palabras y las imágenes a las que corresponden, como paisajes, construcciones y plantas. GauGAN 2 es la segunda versión del software y trae consigo una mejora significativa en la calidad de las imágenes y mayor coherencia en la composición de los objetos.

GauGAN 2 combina mapeo de segmentación, pintura interna y generación de texto a imagen, lo que la convierte en una herramienta para diversos paisajes, ciudades e imágenes abstractas.

“Esta tecnología no consiste simplemente en unir piezas de otras imágenes o cortar y pegar texturas [...] En realidad, está sintetizando nuevas imágenes, muy similar a cómo un artista dibujaría algo", explicó Bryan Catanzaro, vicepresidente de investigación de aprendizaje profundo aplicado en NVIDIA.

Por el momento, la tecnología aún se encuentra en desarrollo, sin embargo, Nvidia busca que esta I.A. sea de utilidad para creación de mundos virtuales, arte en videojuego y más utilidades que se irán mejorando en los próximos años.

“GauGAN podría ofrecer una poderosa herramienta para crear mundos virtuales para todos, desde arquitectos y urbanistas hasta diseñadores de paisajes y desarrolladores de juegos. Con una IA que comprende cómo se ve el mundo real, estos profesionales podrían crear mejores prototipos de ideas y realizar cambios rápidos en una escena sintética”, señaló la compañía

La I.A. ofrece al usuario una interfaz sencilla, pero con una gran capacidad de segmentación que permite identificar los objetos que están disponibles para pintar. A partir de ahí, se puede cambiar la imagen dibujando o usando etiquetas, lo que permite que el pincel inteligente incorpore estos garabatos en imágenes.

Nvidia explicó que la red neuronal detrás de GauGAN2 produce “una mayor variedad y calidad de imágenes”, en comparación con otros modelos que realizan el cambio de texto a imagen o de mapa de segmentación a imagen.

Actualmente, GauGAN está disponible para que cualquier usuario pueda experimentar y ver que tan capaz es la I.A. en representar el dibujo. Aunque el software es bastante avanzado, cuenta con algunos errores, ya sea para detectar algún objeto en específico o dar profundidad a la imagen.