
El reciente lanzamiento de Sora, la aplicación de OpenAI que ofrece un flujo ininterrumpido de videos generados exclusivamente por inteligencia artificial, ha superado el millón de descargas en menos de cinco días, según informó Bill Peebles, responsable de la app, en declaraciones recogidas por MIT Technology Review.
Este ritmo de adopción ha superado incluso al de ChatGPT en su debut, a pesar de que Sora solo está disponible mediante invitación y exclusivamente para dispositivos iOS desde el 30 de septiembre.
La propuesta de Sora se distingue por su formato similar a TikTok, donde los usuarios pueden desplazarse por una secuencia interminable de videos de hasta 10 segundos, todos creados por IA. Una de las funciones más llamativas es la posibilidad de generar un “cameo”: un avatar hiperrealista que replica tanto la apariencia como la voz del usuario, y que puede insertarse en videos propios o ajenos, dependiendo de los permisos configurados.
Esta característica también permite incluir cameos de otras personas, lo que ha suscitado interrogantes sobre los límites y el control de la identidad digital.
El contenido que predomina actualmente en Sora abarca desde grabaciones simuladas de cámaras corporales de policías deteniendo mascotas o personajes reconocidos como SpongeBob y Scooby Doo, hasta memes deepfake de Martin Luther King Jr. hablando sobre consolas Xbox, y múltiples versiones de Jesucristo interactuando con el mundo contemporáneo.

La facilidad para crear y compartir este tipo de videos ha generado tanto fascinación como escepticismo entre los usuarios y observadores del sector.
Para quienes confiaban en la promesa de OpenAI de desarrollar inteligencia artificial en beneficio de toda la humanidad, Sora representa una paradoja. Un antiguo investigador de la compañía, que abandonó la empresa para fundar una startup de IA aplicada a la ciencia, calificó la aplicación como una “máquina infinita de basura de TikTok generada por IA”, según recogió Technology Review.
No obstante, la popularidad de Sora en la App Store de Estados Unidos sugiere que existe una demanda considerable por este tipo de experiencias digitales.
El atractivo de Sora parece residir en dos factores principales. Por un lado, podría tratarse de una moda pasajera, donde los usuarios se sienten atraídos por la novedad de ver hasta dónde puede llegar la IA generativa, aunque el interés se disipe rápidamente.
Por otro, OpenAI apuesta a que se está produciendo un cambio genuino en el tipo de contenido que capta la atención, ya que Sora permite una creatividad fantástica que no es posible en otras plataformas. Un usuario resumió esta sensación al afirmar: “Es reconfortante porque sabes que todo lo que ves no es real, mientras que en otras plataformas a veces tienes que adivinar si es real o falso. Aquí no hay dudas, todo es IA, todo el tiempo”, según cita MIT Technology Review.

El futuro de Sora dependerá de varias decisiones estratégicas: la forma en que OpenAI implemente la publicidad, los límites que establezca respecto al uso de contenido protegido por derechos de autor y los algoritmos que definan la visibilidad de los videos.
Además, la sostenibilidad financiera de la aplicación plantea interrogantes. Aunque la falta de rentabilidad no es inusual en Silicon Valley, la apuesta de OpenAI por una plataforma de generación de video —la forma de IA más intensiva en consumo energético y, por ende, la más costosa— resulta llamativa.
La compañía participa en un proyecto de medio billón de dólares para construir centros de datos y nuevas plantas de energía, pero Sora, que actualmente permite la creación ilimitada y gratuita de videos, incrementa la presión sobre los recursos.
El propio Sam Altman, CEO de OpenAI, reconoció en un blog el 3 de octubre que “tendremos que encontrar la manera de monetizar la generación de video”, aunque no ofreció detalles concretos. Entre las opciones, se barajan anuncios personalizados y compras dentro de la aplicación.
El impacto ambiental de Sora también es motivo de preocupación. Aunque Altman ha descrito la huella de carbono de una consulta a ChatGPT como insignificante, no ha cuantificado el coste energético de generar un video de 10 segundos en Sora.
La magnitud de las emisiones asociadas podría convertirse en un tema de debate a medida que la aplicación gane popularidad y los investigadores en IA y cambio climático exijan mayor transparencia.
En el terreno legal, Sora se encuentra en una zona gris. La aplicación está repleta de personajes y música protegidos por derechos de autor, y facilita la creación de deepfakes de celebridades fallecidas.
Según informó The Wall Street Journal y recogió MIT Technology Review, OpenAI ha enviado cartas a los titulares de derechos notificándoles que deberán solicitar la exclusión de la plataforma si no desean que su material sea utilizado, un enfoque poco habitual en la industria. La legislación sobre el uso de material protegido por IA aún no está definida, por lo que se prevé una oleada de demandas judiciales.
En una entrada reciente de blog, Sam Altman reconoció: “Estamos recibiendo muchas solicitudes de titulares de derechos que quieren más control sobre cómo se usan sus personajes en Sora”. Asimismo, aseguró que la empresa planea ofrecer un control más detallado sobre estos contenidos. No obstante, advirtió que “puede haber casos límite de generaciones que se cuelen y no deberían”.
El uso de cameos de personas reales añade otra capa de complejidad. Aunque los usuarios pueden restringir quién puede emplear su avatar, persisten dudas sobre los límites de lo que estos avatares pueden hacer en los videos. Bill Peebles anunció el 5 de octubre que los usuarios ya pueden limitar el uso de su cameo, impidiendo, por ejemplo, su aparición en videos políticos o la pronunciación de ciertas palabras.
La eficacia de estas medidas está por verse, y no se descarta que surjan demandas si un cameo es utilizado de forma indebida, explícita o ilegal.
A pesar de la expectación, el acceso a Sora sigue siendo limitado mediante códigos de invitación, por lo que aún no se ha observado el impacto total de la plataforma.
La cuestión de fondo, según MIT Technology Review, es si la IA podrá crear videos tan atractivos que desplacen a los contenidos reales en la atención de los usuarios, poniendo a prueba tanto la tecnología de OpenAI como la disposición de la sociedad a sumergirse en un flujo infinito de simulaciones.
En cuanto a la tecnología subyacente, Sora se basa en modelos de generación de video por IA que han avanzado notablemente en los últimos años. Junto a Sora, Google DeepMind ha lanzado Veo 3 y la startup Runway presentó Gen-4.
Estas herramientas pueden producir clips casi indistinguibles de grabaciones reales o animaciones CGI. Este año, Netflix utilizó por primera vez un efecto visual generado por IA en la serie El Eternauta, marcando un hito en la producción televisiva de gran escala.
El funcionamiento de estos modelos se apoya en la técnica de difusión latente combinada con transformers. El proceso de difusión consiste en entrenar una red neuronal para revertir la degradación progresiva de una imagen hasta reconstruirla a partir de ruido aleatorio. Para generar videos, el modelo debe limpiar secuencias de imágenes —los fotogramas consecutivos— en lugar de una sola imagen.
La difusión latente optimiza este proceso al trabajar en un espacio matemático comprimido, lo que reduce el consumo de recursos, aunque la generación de video sigue siendo mucho más exigente que la de imágenes o texto.
La integración de transformers permite mantener la coherencia entre los fotogramas, asegurando que los objetos y la iluminación permanezcan consistentes a lo largo del video.

Según Tim Brooks, investigador principal de Sora, la clave está en dividir los videos en pequeños cubos de datos que pueden procesarse como secuencias, lo que facilita el entrenamiento con una amplia variedad de formatos y estilos.
En el ámbito del audio, Veo 3 ha introducido la generación simultánea de sonido y video, logrando sincronización labial, efectos y ruidos de fondo. Demis Hassabis, CEO de Google DeepMind, destacó en MIT Technology Review que “estamos saliendo de la era muda de la generación de video”.
El avance radica en comprimir audio y video en un único dato dentro del modelo de difusión, permitiendo que ambos se generen de forma sincronizada.
Aunque los modelos de difusión se emplean principalmente para imágenes, video y audio, la frontera con los grandes modelos de lenguaje (LLM) se está desdibujando.
Mientras que los LLM tradicionales se basan en transformers para generar texto, Google DeepMind ha experimentado con modelos de difusión para este fin, lo que podría traducirse en una mayor eficiencia energética en el futuro.
La irrupción de Sora y otras aplicaciones similares plantea desafíos técnicos, legales y sociales de gran envergadura. La capacidad de la inteligencia artificial para generar videos hiperrealistas, la gestión de derechos de autor y la protección de la identidad digital se perfilan como los principales ejes de debate en la evolución de este tipo de plataformas.
Últimas Noticias
Meta solicita a sus trabajadores que usen IA para avanzar “5 veces más rápido”
La presión interna impulsa la capacitación y la experimentación tecnológica en todos los equipos, mientras surgen dudas sobre el impacto en la autonomía y la calidad del software

Cómo quitarle el hongo a la lengua de suegra, según la IA
Lo más aconsejable es eliminar las hojas afectadas, disminuir la frecuencia de riego y aplicar un tratamiento fungicida natural

Por qué la generación Z se enfrenta a un “apocalipsis laboral” debido a la inteligencia artificial
Una cuarta parte de los líderes empresariales considera que la mayoría o la totalidad de las tareas desempeñadas por empleados en posiciones iniciales pueden ser realizadas por la IA

Actualizaciones de Windows 10 llegan a su fin: qué opciones tienes si aún no migras a Windows 11
Estas alternativas permiten mantener la seguridad de los equipos por tiempo limitado, aunque presentan restricciones y requisitos específicos

En iPhone y Android: cómo se activa el filtro de llamadas spam o desconocidas
Esta función, incorporada directamente en ambos sistemas operativos, ayuda a minimizar interrupciones, resguardar la privacidad y prevenir posibles fraudes
