O Audacity agora está equipado com novas ferramentas de IA.
Nos últimos anos, temos visto desenvolvimentos notáveis em IA, incluindo funcionalidades alimentadas por IA sendo adicionadas a várias ferramentas populares. E mais IA é algo que já mencionamos em nossas previsões para Linux e código aberto para 2024 .
Desta vez é o Audacity, um dos melhores editores de áudio para Linux , que deu as boas-vindas à IA. Os usuários agora podem aprimorar sua experiência de edição de áudio aproveitando o poder da IA.
Vamos dar uma olhada no que esses recursos fascinantes trazem para a mesa.
Intel fabrica ferramentas de IA
O pessoal da Intel introduziu novos recursos para trabalhar com áudio falado e música, todos alimentados por IA.
Esses recursos fazem parte do conjunto de plugins OpenVINO . Para quem não sabe, o OpenVINO da Intel é uma estrutura de IA que ajuda a acelerar modelos de aprendizagem profunda.
Um aspecto interessante, mas importante, a ser observado é que todos esses recursos são executados localmente no seu PC! Mais especificamente, a CPU ou GPU do PC será utilizada para a parte de processamento.
Edição de podcast
Sempre quis transcrever ou até mesmo traduzir o áudio rapidamente?
A transcrição , que é desenvolvida pelo Whisper da OpenAI, permite que os usuários façam exatamente isso.
Ele produz uma nova faixa de rótulo que inclui texto transcrito/traduzido com base em uma determinada amostra de áudio.
A tradução sempre produzirá a saída em inglês, enquanto a transcrição produzirá a saída no mesmo idioma do áudio de origem.
Por enquanto, apenas o modelo Whisper Base é compatível por padrão. O suporte para mais modelos pode chegar mais tarde.
Semelhante ao efeito de remoção de ruído existente, há supressão de ruído que ajuda a remover ruídos de fundo indesejados de uma amostra de áudio falada.
Como é alimentado por IA, você pode esperar que esse recurso tenha um desempenho melhor do que o efeito de remoção de ruído.
Por enquanto, apenas o modelo Denseunet é suportado por padrão. O suporte para mais modelos pode chegar mais tarde.
Geração Musical
Sim, você leu certo: agora você pode gerar novas músicas dentro da sua máquina!
Music Generation permite aos usuários gerar um trecho de música. Isso é possível graças a um projeto de código aberto chamado Riffusion , que é um modelo de geração de música baseado em Stable Diffusion (um modelo popular de código aberto usado para gerar imagens).
Você gera música fornecendo um prompt de texto e ajustando alguns outros parâmetros, como a duração.
No prompt de texto, você especifica o gênero de música a ser gerado e a IA fará o possível para manter o gênero ao gerar a música.
Existe uma opção para alternar entre o modo Simples padrão e um modo Avançado opcional para obter mais controle, como especificar um prompt de início e um prompt de término.
Além disso, você pode até remixar músicas com Music Style Remix selecionando uma parte de uma faixa musical!
Separação Musical
E se você quisesse criar sua própria faixa instrumental de sua música favorita? Talvez até tenha uma divertida sessão de karaokê com seus amigos?
A Separação de Música permite dividir uma música em uma versão vocal ou instrumental. Existem dois modos de separação oferecidos:
2-Stem produz duas novas faixas para vocais e instrumentais.
4-Stem produz quatro novas faixas para vocal, bateria, baixo e a última de outros instrumentos combinados.
Como usar as ferramentas de IA?
Se você é um usuário Linux, Espere um pouco mais.
Embora a versão do plugin para Windows esteja disponível para download, sua contraparte para Linux não está disponível... ainda.
Se ainda quiser experimentar, você mesmo precisará compilar o projeto. Você pode consultar as instruções oficiais para isso.
0 Comentários