OpenAI, la startup creadora de ChatGPT, ha vuelto a dar la nota. Ahora, con un "bot" que a partir de un texto con instrucciones crea nada menos que un video. Se llama Sora, y por ahora está en etapa experimental. OpenAI ya publicó un video de 60 segundos a modo de lo que vendrá con esta novedad rupturista. Sora anticipa lo que podría ocurrir con el cine, la televisión y las artes visuales en el futuro: su eventual desaparición tal como las conocemos hoy, es decir, hechas por seres humanos. Los medios "techies", que acogen las novedades de OpenAI con ovaciones, olvidan que el propio genio de la empresa, Sam Altman, manifiesta su enorme preocupación por el futuro que abre la tecnología que él y sus ingenieros inventan.
"OpenAI nos vuelve a dejar a todos con la boca abierta con su nueva inteligencia artificial", adelanta con entusiasmo el sitio web Xataka. A continuación la publicación sobre tecnologías digitales explica "qué es y qué puede hacer Sora, el nuevo sistema de inteligencia artificial creado por OpenAI".
Es una nueva revolución de Inteligencia Artificial de los creadores de ChatGPT y DALL-E, que vuelven a innovar en el sector, reseña Xataka. Así como ChatGPT genera texto y DALL-E genera imágenes a partir de texto, lo que hace Sora es generar vídeos a partir de mensajes textuales. De momento, este modelo no es accesible para todos, solo para investigadores de la empresa, pero promete ser la próxima gran revolución.
Sora es entrenado con una enorme biblioteca de videos, así sabe reconocer movimientos, descripciones y cualquier cosa que se le pida, y es capaz de recrearlos en video de alta definición. Sabrá aque se refiere el usuario cuando le habla de tipos de personas, de vestimenta, de accesorios o de efectos visuales.
"Sora supone un avance como nunca antes se había visto en la generación de video por IA, demostrando una profunda comprensión del lenguaje y la percepción visual, dinámica y física. También muestra el potencial de las inteligencias artificiales para crear contenido atractivo e inmersivo para distintos fines, como entretenimiento, educación, arte y comunicación", reseña casi en éxtasis la publicación Cerebrodigital.net
El usuario escribe un "prompt" o comando textual, y Sora generará el video "de la nada", exclama Xataka, claramente obnubilada. Pero no sale "de la nada", precisamente, sino que toma sin permiso, que se sepa, imágenes animadas de su biblioteca de videos, creada con productos creados por humanos. Se plantea el mismo problema de derecho de autor que ya se dio en Hollywood con ChatGPT. Guionistas y actores incluyeron sus reclamos contra el "bot" de OpenAI entre sus reivindicaciones durante la huelga más prolongada que vio Hollywood el año pasado.
Sora es capaz de generar escenas complejas en las que aparecen varios personajes, y también puedes especificar el tipo de movimiento que se quiera realizar. También se puede detallar el entorno. Sora sabrá interpretar lo que se le dice y "cómo son las cosas" en el mundo físico.
SORA: ES DIFICIL creer que son VIDEOS CREADOS POR IA
Sora ha dado a conocer un video que circula en las redes. En él se ha usado un texto de instrucciones o "prompt" en el que se le indicó que cree a una mujer elegante caminando por Tokio después de una lluvia y llena de neones y señalizaciones urbanas. Se le describió la vestimenta de la mujer al detalle, así como sus gafas y rouge. Con estos datos escritos, Sora es capaz de generar con precisión a una persona y cómo está vestida. Además, también refleja detalles como la calle esté bañada por la lluvia.
Este es el intructivo o "promt" entregado a Sora para crear el video demostrativo: "Una mujer elegante camina por una calle de Tokio llena de cálidos neones brillantes y animada señalización urbana. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y lápiz de labios rojo. Camina con seguridad y despreocupación. La calle está húmeda y es reflectante, lo que crea un efecto espejo de las luces de colores. Muchos peatones pasean".
Esto sirve de ejemplo "para que veas las calidades y la fiabilidad a la hora de reflejar lo que le has pedido", describe Xataka. También entiende contextos, y al ser en Tokio ha hecho que la mujer tenga rasgos orientales. Además de todo esto, Sora también permite especificar rasgos como la edad o la vestimenta, o algunos otros atributos físicos y los movimientos.
Las capacidades de Sora dependerán de la habilidad de cada uno para crear "prompts" complejos en los que hacer las mejores descripciones con las que obtener resultados a medida. Es obvio que un buen guionista de cine o TV hará maravillas con Sora, mientras que una persona común tendrá resultados más pobres. Cuanto más detallada sea la descripción del prompt, más detallada será la imagen que se muestre. El potencial y también el peligro que esto implica resultan obvios: un solo buen guionista o director podría producir decenas de capítulos de una serie en unas pocas horas. Sin necesidad de actores, iluminadores, camarógrafos, vestuaristas, escenógrafos y toda la enorme serie de técnicos y artistas que producen cine y series.
De momento, este modelo de inteligencia artificial está en una fase temprana de su desarrollo, y genera vídeos de hasta 60 segundos. Además, la empresa advierte que puede tener algunos problemas a la hora de recrear con exactitud algunas descripciones físicas.
Solo pueden acceder a Sora investigadores de OpenAI. Por lo tanto, está todavía limitada a pruebas de laboratorio, con las que se está probando su funcionamiento.
OpenAI asegura que Sora se acabará incorporando al catálogo de productos de la empresa, pero todavía no ha dado ninguna fecha concreta. De momento, dicen que primero deben tomar medidas para garantizar la seguridad de los usuarios. Una tácita admisión de que todo lo que sea IA es terreno inexplorado y potencialmente peligroso. Como ha dicho Sam Altman incansablemente desde que en noviembre de 2022 se convirtió de la noche a la mañana en una celebridad mundial al entregar gratuitamente a todos los internautas a ChatGPT.