Tendencias

Sora: la impactante IA capaz de crear videos hiperrealistas a partir de un texto

POR Vicente Housset Gaete | 21 de febrero 2024

La revolucionaria tecnología de los creadores de ChatGPT es capaz de crear videos en alta resolución de hasta un minuto de duración, utilizando solo una instrucción escrita.

Los avances de la inteligencia artificial continúan a pasos agigantados alrededor del mundo. Mientras que programas como ChatGPT muestran cómo esta tecnología puede escribir complejos análisis, reconstrucciones históricas y hasta obras de poesía; otras herramientas como “Generative Fill”, de Photoshop, muestran las capacidades de la IA en el campo de la generación de imagen.

Sin embargo, estos días todos los ojos han estado puestos en Sora, el modelo de inteligencia artificial creado por OpenAI, compañía responsable de ChatGPT, capaz de generar videos de alta resolución a partir de instrucciones en texto. Este programa ha causado sensación en las redes sociales con sus videos de muestra, los cuales presentan una calidad a la par de los estudios de animación de Hollywood más prestigiosos, o en algunos casos, parecen hasta grabados en un espacio real.

De los videos publicados, destacan la caminata de una distinguida mujer en Tokio, dos mamuts recorriendo un nevado paisaje, y hasta un “tráiler” de una película de astronautas. Todas estas representaciones visuales de las instrucciones escritas tienen hasta un minuto de duración, y carecen por completo de sonido.

Actualmente, el modelo de IA solo se encuentra disponible para investigadores “Red team”, quienes se encargan de buscar problemas en su funcionamiento.

Sora ¿cómo funciona?

De acuerdo al sitio oficial de OpenAI, el programa “utiliza un método ‘de parches’ para transformar información visual de varios tipos, en una representación que produce el entrenamiento de modelos generativos”.

Esta información visual se compone de una significativa cantidad de imágenes y videos, los que se utilizan para “armar” los parches en lo que denominan “espacio latente”.

Posteriormente, este espacio latente comprimido es utilizado para generar el video solicitado.

Asimismo, Sora puede generar imágenes, ya que el modelo puede utilizar los parches “en el espacio temporal de un fotograma”.

De acuerdo al sitio, gracias a este método de parches, el modelo de IA “es capaz de generar videos de duración, resolución y relación de aspecto variable”.

Sora también es capaz de extender videos, ya sea para adelante o para atrás en el tiempo.