Buscar
Cerrar este cuadro de búsqueda.

Tecnología, IA

Sora, la revolución audiovisual de OpenAI

La creación de vídeos mediante inteligencia artificial ya es una realidad gracias a Sora de OpenAI

Sora de Open IA
Por Nuria V. Martín

La inteligencia artificial continúa avanzando a pasos agigantados, transformando radicalmente el panorama digital en diversos ámbitos, incluyendo la creación de contenido multimedia. Una de las innovaciones más recientes en este campo es Sora, desarrollada por OpenAI, una herramienta que promete revolucionar la forma en que se concibe la producción de vídeos.

Sora es una herramienta de inteligencia artificial diseñada por OpenAI, capaz de generar vídeos a partir de descripciones de texto, al igual que ha ocurrido con las imágenes, anteriormente. Esta tecnología se basa en el aprendizaje de redes neuronales artificiales, estructuras computacionales que aprenden de grandes cantidades de datos para crear nuevos contenidos. Sora ha sido entrenada con una enorme cantidad de vídeos y descripciones, lo que le permite comprender y aplicar el funcionamiento de entornos multimedia en sus propias creaciones​​.

Funcionamiento de Sora

Sora de Open IA

Sora se asemeja al de otros modelos de lenguaje, como GPT-4 o DALL-E 3, pero enfocado en la creación de contenido audiovisual. Al recibir una descripción textual o prompt, como "Un gato surfeando en el mar sobre una tabla de surf", Sora es capaz de generar un vídeo que se ajusta a esta descripción. A través de un enfoque innovador que descompone los datos visuales en parches de espacio-tiempo, y aprovechando una arquitectura de transformador, Sora logra generar vídeos de alta fidelidad hasta de un minuto de duración. Este avance es especialmente revolucionario, considerando que intentos anteriores por crear contenido audiovisual a través de IA producían resultados realistas y con muchos problemas de continuidad en el diseño.

La herramienta opera a través de dos procesos clave: entrenamiento e inferencia. El entrenamiento implica el volumen de datos en vídeos e imágenes de duraciones, resoluciones y relaciones de aspecto variables con los que la IA ha sido alimentada para aprender a crear. Inspirándose en los modelos de lenguaje grandes, que adquieren capacidades generalistas al entrenar en datos a escala de internet, Sora utiliza ‘parches visuales’ como una representación escalable y efectiva, permitiendo el entrenamiento en tipos diversos de vídeos e imágenes. Este enfoque permite al modelo predecir ‘parches limpios’ a partir de entradas ruidosas, basándose en información condicional como textos descriptivos.

Por su parte, la inferencia es la capacidad de la IA para comprender las peticiones humanas y generar resultados acordes. Estos procesos permiten que Sora cree vídeos complejos y realistas a partir de simples descripciones con las palabras adecuadas. La flexibilidad en la generación de contenidos de diferentes duraciones, resoluciones y relaciones de aspecto permite a Sora crear vídeos adaptados a una amplia gama de dispositivos y necesidades de contenido.

Las innovaciones tecnológicas suelen traer consigo un conjunto de desafíos y limitaciones que deben ser abordados para mejorar su eficacia y accesibilidad. En el caso de Sora, uno de los retos más significativos para cualquier herramienta de IA es generar contenido que no sólo sea visualmente llamativo, sino también preciso y coherente con las peticiones de los usuarios. Aunque la capacidad de Sora para entender descripciones textuales y convertirlas en vídeos es avanzada, puede haber ocasiones en las que los resultados no cumplan completamente con las expectativas en términos de calidad o relevancia. Además, Sora debe entender no sólo el significado literal de las palabras, sino también el contexto, las implicaciones y las intenciones detrás de ellas.

Aplicaciones de Sora

Sora de Open IA

La capacidad de Sora para generar escenas complejas con personajes interactuando de manera realista abre un mundo de posibilidades para creadores de contenido, educadores, y profesionales del marketing, entre otros. Esta herramienta no sólo puede recrear interacciones dentro de entornos existentes sino también generar nuevos mundos y realidades, marcando un antes y un después en la creación de contenido digital​​.

Ante sus posibles usos se abre el debate sobre la originalidad y los derechos de autor. Sora se basa en vastas cantidades de datos preexistentes para aprender y generar nuevos contenidos. Esto podría suponer que los proyectos se asemejen o incluso repliquen trabajos protegidos por derechos de autor, lo cual es una preocupación ética y legal significativa. Como con cualquier herramienta potente, existe el riesgo de que Sora sea utilizada para fines no éticos o malintencionados, como la creación de desinformación, contenido falso o manipulador.

Lanzamiento de Sora

Sora de Open IA

Aunque aún no se ha anunciado una fecha oficial de lanzamiento para Sora, su desarrollo y las pruebas preliminares sugieren que no tardará en estar disponible para el gran público. En cuanto a su coste, aunque la información es escasa, es probable que Sora siga un modelo de suscripción similar al de otras herramientas de OpenAI, como DALL-E y ChatGPT​​.

Mientras tanto, existen alternativas como Stability Diffusion Video y Lumiere de Google, que también exploran la generación de vídeos mediante IA, aunque cada una con sus propias limitaciones y en distintas etapas de desarrollo​​.

Sora representa un hito en la evolución de la inteligencia artificial aplicada a la creación de contenido audiovisual. Con su capacidad para generar vídeos a partir de descripciones textuales, esta herramienta de OpenAI promete abrir nuevos horizontes para creadores y profesionales de diversas industrias, marcando el inicio de una era en la que la producción de contenido multimedia será más accesible, versátil y creativa que nunca.

Únete a nuestra Newsletter

A través de nuestra Newsletter con Capital te hacemos llegar lo más importante que ocurre en el mundo de la #economía, los #negocios, las #empresas, etc… Desde las últimas noticias hasta un resumen con toda la información más relevante al final del día, con toda comodidad.