LANCAMENTO · THE DECODER · 02 DE MAI DE 2026

xAI lança clonagem de voz a partir de um minuto de áudio

Nova funcionalidade permite a desenvolvedores criar sósias vocais para aplicações de IA no Brasil.

Por Pulso da IA · 02 de mai de 2026 · 3 min de leitura
xAI lança clonagem de voz a partir de um minuto de áudio
Imagem: the-decoder.com

A xAI apresentou sua nova funcionalidade "Custom Voices", que possibilita a criação de clones de voz a partir de apenas um minuto de gravação. A novidade expande as capacidades das APIs Grok Speech-to-Text e Text-to-Speech recentemente lançadas pela empresa.

O que aconteceu

A xAI introduziu o recurso "Custom Voices", permitindo que desenvolvedores criem cópias digitais de suas próprias vozes. Este avanço se baseia nas APIs de reconhecimento de fala (Speech-to-Text) e síntese de fala (Text-to-Speech) do Grok, lançadas anteriormente. A capacidade de gerar um clone de voz utilizável com apenas 60 segundos de áudio representa um passo significativo na democratização da tecnologia de clonagem vocal. A informação foi divulgada pelo portal The Decoder.

Por que importa

A disponibilidade de uma ferramenta que exige um tempo de gravação tão reduzido para clonagem de voz abre novas possibilidades para o mercado brasileiro. Desenvolvedores e empresas de tecnologia no Brasil poderão integrar vozes personalizadas em assistentes virtuais, narrações para conteúdo digital, sistemas de atendimento automatizado e até mesmo em experiências interativas para jogos e aplicativos. A facilidade de uso e a baixa exigência de dados para treinamento podem acelerar a adoção dessas tecnologias em diversos setores, desde o marketing até a educação. A capacidade de replicar nuances da fala humana de forma acessível pode aprimorar a experiência do usuário, tornando as interações com sistemas de IA mais naturais e envolventes.

O que esperar

Com a funcionalidade "Custom Voices" agora acessível, espera-se um aumento na criação de aplicações que utilizam vozes personalizadas. A xAI pode continuar a refinar a tecnologia, buscando maior fidelidade e a capacidade de capturar emoções e estilos de fala específicos. A integração com outras ferramentas de IA, como modelos de linguagem, pode levar a assistentes virtuais ainda mais sofisticados e com personalidade. O desenvolvimento futuro pode incluir opções para gerar vozes em diferentes idiomas ou adaptar o tom e o estilo da voz de forma dinâmica. A comunidade de desenvolvedores provavelmente explorará o potencial criativo e comercial dessa nova capacidade, como detalhado em análises da The Decoder.

FONTE OFICIAL
The Decoder
02 DE MAI DE 2026 · the-decoder.com
Leia o original
PULSO SEMANAL

Recebe no inbox toda quinta.

Top 5 da semana de IA em portugues, em 3 minutos de leitura. Zero spam.

Inscrito. Proxima quinta, 9h, chega no teu inbox.