Ir para o conteúdo

Text to speech - Amazon Polly

0

Text to speech - Amazon Polly - além do áudio, gera também de forma sincronizada, a legenda ? Se não, qual a melhor maneira de ter áudio e legendas sincronizadas ?

feita há um ano136 visualizações
1 Resposta
0

Amazon Polly é um serviço de texto para fala que não gera legendas sincronizadas diretamente. No entanto, o Polly oferece uma funcionalidade que pode ajudar na sincronização de fala e texto.

O Polly fornece um fluxo de metadados adicional que inclui informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Essa funcionalidade permite que os desenvolvedores sincronizem a fala com elementos visuais, como animação facial ou destaque de palavras no estilo karaokê.

Para obter áudio e legendas sincronizadas, você pode usar essa funcionalidade de metadados do Polly em conjunto com outras ferramentas ou serviços da AWS. Por exemplo, você poderia:

  1. Usar o Amazon Polly para gerar o áudio e os metadados de tempo.
  2. Utilizar os metadados para criar legendas sincronizadas manualmente ou através de um script personalizado.
  3. Alternativamente, você poderia usar o Amazon Transcribe (serviço de fala para texto) para gerar uma transcrição do áudio com marcações de tempo, que poderia então ser usada como legenda.

Embora o Polly não gere legendas automaticamente, ele fornece as ferramentas necessárias para criar uma experiência sincronizada entre áudio e texto.
Sources
Amazon Polly Features
Community | All the things that Amazon Comprehend, Rekognition, Textract, Polly, Transcribe, and Others Do

respondido há um ano

Você não está conectado. Fazer login para postar uma resposta.

Uma boa resposta responde claramente à pergunta, dá feedback construtivo e incentiva o crescimento profissional de quem perguntou.