Por favor active JavaScript para poder aprovechar la funcionalidad completa de GMX.

Laboratorios de inteligencia artificial de Google comparten avances en la tecnología de conversión de video a audio

Laboratorios de inteligencia artificial de Google comparten avances en la tecnología de conversión de video a audio

Los laboratorios de inteligencia artificial de Google descubrieron que sus modelos de generación de video 'avanzan a un ritmo increíble'.

Los departamentos de inteligencia artificial del gigante de los motores de búsqueda están trabajando para promover la tecnología de creación de bandas sonoras de IA para videos y adelantaron el 'próximo gran paso adelante' en una actualización.

En una publicación de blog, los laboratorios de inteligencia artificial de Google dijeron:

'Los modelos de generación de video están avanzando a un ritmo increíble, pero muchos sistemas actuales solo pueden generar resultados silenciosos. Uno de los próximos pasos importantes para dar vida a las películas generadas es crear bandas sonoras para estas películas silenciosas'.

La publicación continuó:

'Hoy compartimos el progreso de nuestra tecnología de video a audio (V2A), que hace posible la generación audiovisual sincronizada. V2A combina píxeles de video con indicaciones de texto en lenguaje natural para generar ricos paisajes sonoros para la acción en pantalla'.

Y también destacó:

'Nuestra tecnología V2A se puede combinar con modelos de generación de vídeo como Veo para crear tomas con una partitura dramática, efectos de sonido realistas o diálogos que coincidan con los personajes y el tono de un vídeo. También puede generar bandas sonoras para una variedad de imágenes tradicionales, incluido material de archivo, películas mudas y más, abriendo una gama más amplia de oportunidades creativas'.

La publicación también señaló que V2A puede generar 'bandas sonoras ilimitadas' para adaptarse a cualquier salida y, por lo tanto, los usuarios tendrán 'mucho más control' sobre lo que elijan hacer.

Continuó:

'Es importante destacar que V2A puede generar un número ilimitado de bandas sonoras para cualquier entrada de vídeo. Opcionalmente, se puede definir un 'mensaje positivo' para guiar la salida generada hacia los sonidos deseados, o un -mensaje negativo- para alejarlo de los sonidos no deseados. Esta flexibilidad brinda a los usuarios más control sobre la salida de audio de V2A, lo que permite experimentar rápidamente con diferentes salidas de audio y elegir la mejor combinación'.

Contenido patrocinado

Artículos relacionados