Meta innova en la IA con una nueva herramienta
- ‘Padrinos’ de la inteligencia artificial advierten sobre el riesgo de esta tecnología
- ¿Ecopetrol migrará a la inteligencia artificial? Presidente Ricardo Roa responde
Meta, la empresa matriz de Facebook, Instagram y WhatsApp, ha dado un paso adelante al presentar su última innovación en inteligencia artificial (IA). Se trata de MusicGen, un modelo de IA de fácil uso que permite a los usuarios generar música de alta calidad a partir de una breve descripción en texto y una melodía de referencia.
MusicGen se basa en un enfoque de una sola etapa con patrones de tokens eficientes entrelazados, utilizando EnCodec audio de 32 Khz. Esto reduce la necesidad de emplear múltiples modelos en cascada, como explican los investigadores de Audiocraft. Con este enfoque, MusicGen puede generar muestras de música de alta calidad de aproximadamente doce segundos de duración con solo ingresar una breve descripción en texto y una referencia melódica.
La compañía tecnológica ha publicado una demostración de MusicGen en el portal Hugging Face AI, lo que permite a cualquier usuario generar una muestra de música. Además, se han proporcionado una serie de ejemplos de descripciones, algunos de los cuales van acompañados de descripciones melódicas.
Este avance de Meta se suma a las iniciativas de otras grandes compañías tecnológicas, como Microsoft con OpenAI y ChatGPT, y Google con Bard, que han dado pasos importantes en el campo de la IA. Aunque existen otras herramientas desarrolladas por diferentes empresas, estas compañías han captado la atención debido a su peso e influencia en la industria. Mientras tanto, Meta, ha estado centrada en el desarrollo del metaverso, aunque parece haber puesto ese plan en un segundo plano debido al auge de esta nueva tecnología en todo el mundo. Ahora, Meta busca destacarse presentando ImageBind, su propio modelo de IA que promete avances significativos y pretende superar a ChatGPT.
Según la propia compañía, ImageBind incorpora un sistema multisensorial que le permite aprender de la misma manera que lo hacen los seres humanos, ya que contiene imágenes, texto, video y audio. Estos datos pueden ser procesados con información de profundidad, datos térmicos y de inercia.
“En los sistemas de IA tradicionales, se utiliza una incorporación específica para cada modalidad respectiva, es decir, vectores numéricos que representan los datos y sus relaciones en el aprendizaje automático. ImageBind demuestra que es posible crear un espacio de incorporación conjunto para múltiples modalidades sin necesidad de entrenar datos para cada combinación diferente de modalidades”, explica la compañía. Meta ha destacado que su nueva herramienta tiene infinitas posibilidades en comparación con ChatGPT o MidJourney. Han intentado generar un sistema que les permita obtener información sobre un mismo objeto desde diferentes perspectivas, como su olor, los sonidos que produce y su apariencia.