Meta anunció el lanzamiento de su herramienta de Inteligencia Artificial (IA) “Voicebox”, el que va a funcionar como un ChatGPT para la generación de voz. Podrá transformar textos a audios en diferentes idiomas y va a poder editar grabaciones para quitar ruidos de fondo.

Meta lanzó “Voicebox” por la tarde del dieciseis de junio, una IA de generación de voz que va a poder editor audios, muestrear y afinar, generar audios de alta calidad y quitar estruendos de fondo como estruendos exterior. Será multilingüe, ya que generará audios en 6 idiomas.

“Voicebox” pegará voces a asistentes virtuales, e inclusive de personajes que no deben ver con jugadores del metaverso. Permitirá a personas con discapacidad visual escichar mensajes escritos y promete brindar a autores de contenido pistas de audio para sus vídeos.

Meta descubrió lo siguiente sobre “Voicebox”:

“Voicebox” es un esencial paso adelante en nuestra investigación generativa de IA, y aguardamos proseguir nuestra exploración en el espacio del audio y ver de qué forma otros estudiosos se fundamentan en nuestro trabajo”.

Meta especificó que del mismo modo que otras herramientas de IA Generativa, “Voicebox” solo puede crear audios de salida de alta calidad desde cero, alterar muestras, mas en vez de imágenes o vídeos, generará audio de alta calidad. Es decir, va a poder modiciar cualquier una parte de una muestra determinada, no solamente la parte final de un clip.

Además, Meta asegura que “Voicebox” superaría a todas y cada una de las IA en su tipo, por su sencillez de “aprendizaje de contexto”, lo que se traduce en mejores tasas de fallo por palabra, semejanza de audio mejorada y rendimientos veinte veces más veloces.

Meta alardea que con “Voicebox” empieza una “nueva era” de la IA

Meta AI apostilló ciertos aspectos de su IA de voz:

“Este trabajo representa un importante paso adelante en este campo de investigación. Al igual que otros trabajos para imágenes + texto, creemos que la generalización y la escalabilidad de Voicebox podrían marcar el comienzo de una nueva era de IA generativa para el habla; estamos entusiasmados de seguir impulsándolo”.

Asimismo, “Voicebox” dejará una pluralidad de labores como:

  • Síntesis de texto a voz en contexto.
  • Edición de voz y reducción de estruendos.
  • Transferencia de estilo entre idiomas.
  • Muestreo diverso al habla.

El lanzamiento llega cuando Meta está en pérdidas desde hace unos meses. En el primer trimestre del año ganó veinticuatro% menos, aunado a que debió desamparar el metaverso y verse obligado a abrazar la IA. No solo eso, la compañía se vio opacada por el reciente lanzamiento de las Apple Vision Pro, las nuevas lentes de Realidad Aumentada de Apple.

Marco Novak

Monterrey (México), 1990. Estudió una licenciatura en comunicación y comenzó trabajando en medios locales de su ciudad, como periódicos, revistas, estaciones de radio o canales de televisión. Tiene un gran interés por la cultura mexicana, incluyendo la música, la comida y la historia. Es un apasionado de los deportes, especialmente del fútbol.