GANverse3D es una nueva plataforma desarrollada por el equipo de NVIDIA Al Research Lab de Toronto, Canadá, que es capaz de crear modelos 3D a partir de una fotografía. Para lograrlo, el sistema utiliza la inteligencia artificial y mediante potentes algoritmos interpreta imágenes 2D. Por el momento solo funciona con coches, pero es cuestión de tiempo que aprenda también a interpretar imágenes planas de otros objetos.
De hecho, una de las aplicaciones más esperanzadoras de esta solución sería la de ahorrar tiempos y costes de producción en el sector de los videojuegos, el cine o la publicidad. La capacidad de automatizar procesos de modelado 3D, texturizado y render, que hoy por hoy son caros y laboriosos, supondría el inicio de una nueva era en el mundo de la animación gracias a la inteligencia artificial.
A nivel lúdico, hemos visto el uso de la inteligencia artificial para la interpretación y posterior animación de imágenes en aplicaciones como Wombo AI. Sin embargo, NVIDIA va un paso más allá con su propuesta, ya que afecta directamente a sectores tecnológicos que manejan grandes sumas de dinero. Solo en España, la industria del videojuego facturó 1.747 millones de euros en 2020.
Para entender el funcionamiento de GANverse3D lo primero que hay que tener en cuenta es que se trata de un motor basado en inteligencia artificial y apoyado en un sistema de Deep Learning (aprendizaje profundo). Esto significa que dicho motor ha sido entrenado para interpretar y entender las formas tridimensionales de un objeto con solo analizar y etiquetar una foto del mismo. Para llegar a este asombroso resultado, y en eso consiste el entrenamiento, los investigadores de NVIDIA crearon una red generativa que sintetizaba imágenes 2D de un objeto desde diferentes ángulos y perspectivas. Esas imágenes son las que aportan la información necesaria con la que el motor elabora y anima en tiempo real el modelo 3D de ese objeto.
En el caso de un coche, para que GANverse3D aprenda cómo es tridimensionalmente, ha tenido que analizar miles de imágenes de los laterales, el frontal, la parte trasera y la superior. Las diferentes perspectivas del objeto se combinan en un framework de renderizado que, mediante un proceso de inferencia, se ocupa de generar el modelo 3D. Una vez finalizado el proceso de entrenamiento, el motor ya solo necesitará una foto del objeto para identificarlo correctamente y generar el modelo 3D dentro de la plataforma Omniverse de NVIDIA y haciendo uso de las tarjetas gráficas RTX de la compañía. En el modelado tradicional, el artista visual necesita un conjunto de varias imágenes conocidas como image plane (laterales, frontal y parte trasera) para reproducir un objeto de forma realista manejando complicadas herramientas. Este sistema desarrollado por NVIDIA demuestra una vez más el enorme potencial que ofrece la inteligencia artificial.
Concretamente en el campo de los videojuegos, la inteligencia artificial lleva ocupando un papel protagonista casi desde los inicios, sobre todo a la hora de determinar el comportamiento de los Personajes No Jugadores (PNJ). NVIDIA, muy conocida como fabricante de tarjetas gráficas para ordenadores, ya cuenta con una dilatada experiencia desarrollando entornos de aprendizaje para máquinas. Por otro lado, su tecnología DLSS para mejorar el procesado de gráficos es una de las más importantes y sitúa a la multinacional con sede en California en un puesto destacado dentro del sector.
Blog ÓN
Comité de contenidos