Así funciona la herramienta de Meta que traduce instantáneamente de voz a voz en 36 idiomas
Meta, compañía de Mark Zuckerberg, diseña un modelo de Inteligencia Artificial (IA) llamado SEAMLESSM4T, que traduce instantáneamente de voz a voz en 36 idiomas
La compañía que engloba las redes sociales como Facebook, Instagram, Threads y WhatsApp, conocida como Meta, desarrolló un modelo de Inteligencia Artificial (IA) que traduce instantáneamente de voz a voz en 36 idiomas. Este avance promete acercar a la humanidad a un futuro sin barreras lingüisticas. Su nombre es “SEAMLESSM4T” y en adn40 te enseñamos cómo funciona la nueva herramienta de Mark Zuckerberg.
Meta dice "no más verificación de datos" en Facebook, Instagram ¡y más!
Meta, la compañía detrás de Facebook, Instagram y WhatsApp, anunció que eliminará su sistema de verificación de datos por terceros en sus plataformas.
Suscríbete a nuestro canal de WhatsApp y lleva la información en la palma de tu mano.
¿Qué es SEAMLESSM4T?
El modelo SEAMLESSM4T no solo traduce directamente de voz a voz, sino que también soporta:
- Voz a texto: Traduce de 101 a 96 idiomas.
- Texto a voz: Convierte texto en 36 idiomas diferentes.
- Texto a texto: Traduce hasta en 96 idiomas.
- Reconocimiento automático de voz: Compatible con 96 lenguas.
En el caso de las traducciones de voz a voz, el modelo logra una precisión hasta un 23% superior a los sistemas existentes, según un artículo publicado en la revista Nature. Además, es capaz de filtrar el ruido de fondo y adaptarse a diferentes acentos y tonos de los hablantes.
¿Cómo funciona SEAMLESSM4T, traductor de Meta?
A diferencia de los sistemas actuales, que suelen traducir primero la voz a texto y luego al idioma objetivo, SEAMLESSM4T realiza una traducción directa de un idioma a otro. Por ejemplo, puede convertir el inglés hablado directamente al alemán hablado sin necesidad de pasos intermedios.
Este modelo es de código abierto para uso no comercial, lo que fomenta la investigación y el desarrollo de tecnologías inclusivas. Por el momento no se encuentra disponible al público en general, sin embargo, como cada actualización presentada por Meta, Mark Zuckerberg compartirá sus funciones a través de Facebook.
Retos pendientes en la tecnología del habla
Aunque SEAMLESSM4T traduce 101 idiomas, todavía está lejos de cubrir las cerca de 7 mil idiomas que se hablan en el mundo. Además, enfrenta desafíos en entornos ruidosos o con acentos muy marcados, lo que limita su rendimiento en situaciones complejas.
¿Qué dicen los expertos de SEAMLESSM4T de Meta?
Investigadores como Tanel Alumäe de Google, destacan que esta tecnología podría abrir nuevas posibilidades en la traducción universal. Sin embargo, advierten que es crucial seguir mejorando el modelo para reducir sesgos y garantizar su eficacia en diferentes contextos.
@Nature asked to write a short comment piece about the SeamlessM4T paper from @AIatMeta (https://t.co/TcEYNnPL07), here it is: https://t.co/pZu6xR1EtD. I think SeamlessM4T is still the best publicly available multilingual ASR/speech-translation model.
— Tanel Alumäe (@TanelAlumae) January 16, 2025
Con este avance, Meta da un gran paso hacia la comunicación global, aunque todavía hay camino por recorrer para que esta tecnología se acerque a la perfección prometida por la ciencia ficción.
adn40 Siempre Conmigo. Suscríbete a nuestro canal de Telegram y lleva la información en tus manos