বিড়ালছানা টিটিএস হ’ল একটি ওপেন-সোর্স রিয়েলিস্টিক টেক্সট-টু-স্পিচ মডেল যা কেবল 15 মিলিয়ন পরামিতি সহ, হালকা ওজনের স্থাপনা এবং উচ্চমানের ভয়েস সংশ্লেষণের জন্য ডিজাইন করা।
pip install
from kittentts import KittenTTS
m = KittenTTS("KittenML/kitten-tts-nano-0.1")
audio = m.generate("This high quality TTS model works without a GPU", voice="expr-voice-2-f" )
# available_voices : ( 'expr-voice-2-m', 'expr-voice-2-f', 'expr-voice-3-m', 'expr-voice-3-f', 'expr-voice-4-m', 'expr-voice-4-f', 'expr-voice-5-m', 'expr-voice-5-f' )
# Save the audio
import soundfile as sf
sf.write('output.wav', audio, 24000)