12 de abr 2025
Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve
Mati Staniszewski, co fundador da ElevenLabs, antecipa que em dois a três anos a tradução de voz em tempo real será uma realidade acessível, superando barreiras linguísticas. A empresa, que se destaca na síntese de fala e dublagem multilíngue, já apresenta avanços significativos na preservação de emoção e tom, embora desafios como a detecção de nuances emocionais e a identificação de falantes em ambientes ruidosos ainda persistam. Com parcerias estratégicas, como a recente com o Google Cloud, a ElevenLabs busca expandir suas soluções, prometendo um futuro onde a comunicação entre diferentes idiomas seja fluida e natural.
Quando falaremos sem barreiras linguísticas? (Foto: Reprodução)
Ouvir a notícia:
Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve
Ouvir a notícia
Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve - Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve
A ElevenLabs, co-fundada por Mati Staniszewski, é uma empresa de inteligência artificial que se destaca na síntese de fala realista e dublagem multilíngue. Em entrevista, Mati afirmou que, em dois a três anos, a tradução de voz em tempo real será amplamente acessível, com melhorias na preservação de emoção e tom. A empresa já firmou parcerias com gigantes como o Google Cloud.
Mati destacou que a tecnologia atual já permite traduções em casos específicos, como suporte ao cliente e saúde, mas ainda enfrenta desafios na captura de nuances emocionais e na identificação de falantes em ambientes ruidosos. Ele acredita que a solução para a tradução em tempo real está próxima, com avanços significativos previstos para os próximos anos.
A ElevenLabs já implementou suas soluções em empresas, facilitando a comunicação entre agentes de atendimento e clientes que falam diferentes idiomas. No entanto, a preservação do tom emocional ainda é um desafio em situações mais complexas, como dublagens em tempo real de eventos esportivos.
Mati também mencionou que a empresa está desenvolvendo um modelo que detecta interrupções e ajusta as respostas em tempo real, visando reduzir a latência para conversas naturais. Atualmente, a latência média é de um a 1,2 segundos, com o modelo de síntese de fala alcançando apenas 70 milissegundos. A ElevenLabs continua a investir em pesquisa e desenvolvimento para aprimorar suas soluções.
Perguntas Relacionadas
Comentários
Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.