Criar o seu próprio assistente de voz com o Raspberry Pi é uma maneira divertida de tornar sua casa inteligente. Também permite uma grande personalização. Você pode escolher o quanto o sistema é interativo, integrar IA com ferramentas como ChatGPT e até mesmo animar figuras holográficas para visualizar seu personagem. Mas se você sempre quis mudar a forma como seu assistente de voz soa, você deve conferir o último projeto de Erik Bjorgan, o TextoMcSpeechy.
Esta ferramenta de código aberto permite adicionar um perfil de voz personalizado ao seu projeto de conversão de texto em fala (TTS). Segundo Bjorgan, o projeto foi criado por necessidade. Ele estava procurando uma maneira de criar um modelo personalizado de sua própria voz para poder usá-lo em um projeto de conversão de texto em fala baseado no Raspberry Pi. Mas quando ele pesquisou online, não encontrou uma maneira fácil de fazer isso, então ele desenvolveu um processo simplificado que qualquer pessoa poderia usar.
O TextoMcSpeechy funciona para quem deseja fazer seu próprio modelo TTS do zero ou criar um usando amostras da voz de outra pessoa. Ele funciona com o Applio, um sistema de IA de código aberto voltado para clonagem de vozes para uso em TTS. Bjorgan confirmou que ele próprio está usando a configuração para recriar vozes de celebridades em seus vários dispositivos domésticos inteligentes, então as possibilidades são imensas.
Bjorgan compartilhou uma lista completa de recursos do TextoMcSpeechy na página oficial do projeto no GitHub. Isso inclui coisas como a capacidade de criar modelos TTS usando suas próprias gravações vocais ou conjuntos de dados coletados por outra pessoa. Mas também menciona a capacidade de usar arquivos de checkpoint para treinar modelos TTS mais rapidamente, mantendo a qualidade.
A página do GitHub fornece instruções sobre como usar o TextoMcSpeechy, bem como detalhes sobre o que você precisa para criar um modelo TTS. Você precisará de um conjunto de dados de voz do indivíduo cuja voz deseja clonar e, em seguida, precisará associar esse áudio ao texto para que o sistema possa construir um perfil da voz. Se o seu projeto com o Raspberry Pi precisa de uma voz personalizada, confira o TextoMcSpeechy e teste por si mesmo.