¿De dónde se inspiró OpenAI para la creación de Sora?

La generación de video a través de inteligencia artificial (IA) ya era una realidad, pero OpenAI llegó para revolucionar el concepto a través de su nuevo sistema llamado SORA.

3 minutos de lectura.
Compartir:
Escrito por: César Heredia
Sora
Freepik

OpenAI marcó un hito en el campo de la inteligencia artificial con el lanzamiento de un modelo de generación de video denominado Sora. Las demostraciones de Sora deslumbraron al público con videos que parecían desafiar los límites de lo fotorrealista, generados a partir de simples indicaciones a través de texto. Desde reflejos en ventanas de trenes hasta de visuales que parecieran trailers de películas que evocaban la estética de directores de renombre, Sora parece tener la capacidad de crear contenido visual complejo y detallado.

Suscríbete a nuestro canal de Telegram y lleva la información en tus manos

La innovación detrás de Sora suscitó una pregunta fundamental sobre ¿cómo logró OpenAI este avance? La respuesta aún no es concreta, ya que OpenAI mantuvo en secreto los detalles específicos sobre los datos de entrenamiento utilizados. Sin embargo, lo que se sabe es que para alcanzar tal nivel de sofisticación, Sora requirió una vasta cantidad de datos de video, presumiblemente extraídos de diversas fuentes en Internet. Esto ha llevado a especulaciones sobre la inclusión de contenido protegido por derechos de autor en su entrenamiento, aunque OpenAI no confirmó ni negado estas afirmaciones.

OpenAI mencionó a través de un documento técnico que Sora se inspira en los grandes modelos de lenguaje, los cuales adquieren capacidades generalistas a través del entrenamiento con datos a escala de Internet. Este enfoque sugiere que la fuente de los datos visuales para Sora es, de hecho, todo el vasto mar de contenido disponible que existe línea. La necesidad de entrenar sistemas de generación de texto a video con grandes cantidades de videos y subtítulos correspondientes apunta aún más al Internet como la principal fuente de estos datos.

La adquisición de datos de entrenamiento para modelos de IA ha sido un tema de debate legal y ético desde el lanzamiento de ChatGPT por parte de OpenAI. La utilización de datos extraídos de redes sociales, foros en línea, bases de datos de libros privados y sitios de noticias generaron acusaciones de “robo” de datos contra OpenAI y otros gigantes tecnológicos. El caso del New York Times contra OpenAI y Microsoft por infracción de derechos de autor revela el panorama sobre el complejo terreno legal en el que se mueven estos desarrollos.

La posibilidad de que Sora esté entrenado con videos protegidos por derechos de autor encendió alarmas en la industria del entretenimiento, donde se anticipa que esta tecnología pueda tener implicaciones significativas. La falta de transparencia de OpenAI sobre los datos de entrenamiento generó preocupación entre artistas y creativos, quienes temen que sus obras hayan sido utilizadas sin su consentimiento.

 OpenAI lanza curso gratuito sobre ChatGPT
También te puede interesar:

Aprende sobre inteligencia artificial con este curso gratuito de ChatGPT

¡Aprovecha la oportunidad! La compañía de investigación sobre inteligencia artificial, OpenAI, lanzó un curso gratuito sobre ChatGPT; te contamos los detalles.

Ver nota

OpenAI ha reconocido los potenciales daños relacionados con los deepfakes y la desinformación que Sora podría generar, y se encuentra en una fase de “red-teaming” para identificar y mitigar contenido inapropiado. Este último término se refiere a un ejercicio o análisis que se realizaría para conocer el nivel de protección y respuesta ante posibles riesgos, con el fin de reforzar seguridad.

Además, la compañía expresó anteriormente su intención de dialogar con legisladores, educadores y artistas para explorar usos positivos de esta tecnología. Sin embargo, estas medidas no abordan completamente las preocupaciones sobre los daños potenciales derivados de la metodología de entrenamiento de Sora.

Mientras que Sora representa un avance impresionante en la generación de video por IA, las incógnitas sobre sus fuentes de datos subrayan debates en curso sobre la ética y la legalidad en el entrenamiento de modelos de inteligencia artificial. La comunidad espera que OpenAI ofrezca mayor claridad sobre estos aspectos para asegurar que innovaciones como Sora puedan ser desarrolladas y utilizadas de manera responsable.

adn40 Siempre Conmigo. Síguenos en Showcase de Google News y mantente siempre informado

¡No te pierdas nuestro contenido, sigue a adn40 en Google News!