Las empresas chinas de IA compiten para diferenciarse de sus competidores en el mercado de texto a vídeo

Las empresas chinas, desde la startup Zhipu AI hasta el gigante tecnológico ByteDance, se han apresurado a lanzar herramientas de creación de vídeos de IA en los últimos días, pero enfrentan desafíos para diferenciarse de sus rivales locales en el mercado.

Otras nuevas empresas que ingresan al mercado incluyen Kuaishou Technology, un operador de plataforma de videos cortos, y la startup Shengshu AI, que ha lanzado herramientas para crear videos para uso público. El gigante del comercio electrónico Alibaba Group Holding también ha publicado un marco para una herramienta estilo Sora. Alibaba es propietaria del South China Morning Post.

Aunque las empresas chinas están unos meses por detrás de Sora de OpenAi en el desarrollo de modelos que pueden convertir texto en vídeos, han demostrado la capacidad de ponerse al día rápidamente en esta área, dijeron los analistas.

Los modelos de texto a video se han disparado gracias a la fuerte inversión de China en modelos de inteligencia artificial, dijo Lu Yanxia, director de investigación de tecnologías emergentes de IDC China. OpenAI, respaldado por Microsoft, fue pionero en la generación de texto a video con el debut de Sora en febrero, pero la startup con sede en San Francisco aún no ha puesto el producto a disposición del público en general, con solo un número limitado de usuarios beta con acceso.

En esta ilustración, un vídeo creado por la herramienta de conversión de texto a vídeo de Open AI, Sora, se reproduce en una pantalla en Washington, D.C., el 16 de febrero de 2024. Foto: AFP/Getty Images/TNS

ByteDance fue el último entre sus pares en presentar su versión de la aplicación Sora, con una herramienta de video llamada Gaming lanzada en las tiendas locales de Android el 31 de julio. Acepta tanto texto como imágenes para crear un clip de hasta 12 segundos, lo que lo convierte en la primera opción en cuanto a duración del vídeo.

READ Noticias principales: rumores de iOS 17 y watchOS 10, cuándo esperar un nuevo iMac y más

El modelo de Kuaishou puede crear vídeos de un máximo de 10 segundos, mientras que Qing de ZhipuAI y Vidu de Shengshu producen vídeos de entre cuatro y seis segundos de duración. Por otro lado, Shengshu tiene una velocidad de producción rápida. Se necesitan menos de 30 segundos para crear un vídeo de cuatro segundos, mientras que la mayoría de los otros servicios tardan más en crear un vídeo de una duración similar.

Un empleado de una empresa de inteligencia artificial, que pidió permanecer en el anonimato, afirmó que los modelos desarrollados por las empresas chinas son homogéneos y no difieren mucho entre sí. Más bien, las empresas se diferenciarán en función de los servicios que prestan y las industrias a las que se dirigen.

Los cuatro servicios han adoptado un modelo gratuito, que permite a los usuarios probar los servicios de forma gratuita pero con tiempos de espera más largos durante los períodos pico. También ofrece planes de precios para que los usuarios puedan evitar retrasos y obtener beneficios adicionales, como videos HD.

Lu, de IDC, espera que los modelos de vídeo sean adoptados primero por el sector de Internet, especialmente para la transmisión en vivo y los videojuegos, seguido de aplicaciones en ciudades inteligentes y manufactura.

“Esta será la principal área competitiva para las tecnologías de IA generativa”, añadió.

Vito Gil

“Alborotador. Amante de la cerveza. Total aficionado al alcohol. Sutilmente encantador adicto a los zombis. Ninja de twitter de toda la vida”.

Las empresas chinas de IA compiten para diferenciarse de sus competidores en el mercado de texto a vídeo

Vito Gil

Leave A Comment Cancelar la respuesta

Entradas recientes

Páginas