Tecnologia

Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve

Mati Staniszewski, co fundador da ElevenLabs, antecipa que em dois a três anos a tradução de voz em tempo real será uma realidade acessível, superando barreiras linguísticas. A empresa, que se destaca na síntese de fala e dublagem multilíngue, já apresenta avanços significativos na preservação de emoção e tom, embora desafios como a detecção de nuances emocionais e a identificação de falantes em ambientes ruidosos ainda persistam. Com parcerias estratégicas, como a recente com o Google Cloud, a ElevenLabs busca expandir suas soluções, prometendo um futuro onde a comunicação entre diferentes idiomas seja fluida e natural.

Quando falaremos sem barreiras linguísticas? (Foto: Reprodução)

Quando falaremos sem barreiras linguísticas? (Foto: Reprodução)

Ouvir a notícia

Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve - Tecnologia de tradução em tempo real promete eliminar barreiras linguísticas em breve

0:000:00

A ElevenLabs, co-fundada por Mati Staniszewski, é uma empresa de inteligência artificial que se destaca na síntese de fala realista e dublagem multilíngue. Em entrevista, Mati afirmou que, em dois a três anos, a tradução de voz em tempo real será amplamente acessível, com melhorias na preservação de emoção e tom. A empresa já firmou parcerias com gigantes como o Google Cloud.

Mati destacou que a tecnologia atual já permite traduções em casos específicos, como suporte ao cliente e saúde, mas ainda enfrenta desafios na captura de nuances emocionais e na identificação de falantes em ambientes ruidosos. Ele acredita que a solução para a tradução em tempo real está próxima, com avanços significativos previstos para os próximos anos.

A ElevenLabs já implementou suas soluções em empresas, facilitando a comunicação entre agentes de atendimento e clientes que falam diferentes idiomas. No entanto, a preservação do tom emocional ainda é um desafio em situações mais complexas, como dublagens em tempo real de eventos esportivos.

Mati também mencionou que a empresa está desenvolvendo um modelo que detecta interrupções e ajusta as respostas em tempo real, visando reduzir a latência para conversas naturais. Atualmente, a latência média é de um a 1,2 segundos, com o modelo de síntese de fala alcançando apenas 70 milissegundos. A ElevenLabs continua a investir em pesquisa e desenvolvimento para aprimorar suas soluções.

Meu Tela
Descubra mais com asperguntas relacionadas
crie uma conta e explore as notícias de forma gratuita.acessar o meu tela

Perguntas Relacionadas

Participe da comunidadecomentando
Faça o login e comente as notícias de forma totalmente gratuita
No Portal Tela, você pode conferir comentários e opiniões de outros membros da comunidade.acessar o meu tela

Comentários

Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.

Meu Tela

Priorize os conteúdos mais relevantes para você

Experimente o Meu Tela

Crie sua conta e desbloqueie uma experiência personalizada.


No Meu Tela, o conteúdo é definido de acordo com o que é mais relevante para você.

Acessar o Meu Tela