Чөлөөт AI Үгнээс үсэг рүүName
31+ нээлттэй эхийн загварууд, 231+ дуунууд, 34+ Тоглоомын нэр:
Таны дууны AI-д хэрэгтэй бүх зүйлName
30+ хэрэгслийг нээлттэй эхийн хиймэл оюун ухааны загвараар хангана
31+ AI дууны загвар
Нэг платформд хамгийн өргөн хүрээтэй нээлттэй эхийн TTS загварууд
Kokoro Free
Kokoro нь 82 сая параметртэй, өөрийн жингийн ангилалд багтах чадвартай текст- рүү- яриа загвар юм. Энэ нь жижигхэн боловч, гайхалтай, илэрхийлэлтэй яриаг гаргаж өгдөг. Kokoro нь Англи, Япон, Хятад, Солонгос зэрэг олон хэлийг дэмждэг бөгөөд олон янзын илэрхийлэлтэй дуу хоолойг гаргаж өгдөг. Энэ нь маш хурдан ажилладаг - график процессор дээрх бодит цагаасаа 100 дахин хурдан дуу үүсгэдэг.
Хамгийн тохиромжтой: Хамгийн бага хугацаа шаардсан чанартай TTS, шууд дамжуулах програмууд
Үнэгүй туршиж үзэх
Piper Free
Piper бол Rhasspy- ийн боловсруулсан VITS болон larynx архитектуруудыг ашигласан хөнгөн жинтэй текст- рүү- яриа хөдөлгүүр юм. Энэ нь бүхэлдээ CPU дээр ажилладаг, үүнийг edge төхөөрөмжүүд, гэр ахуйн автоматжуулалт, болон холбоогүй TTS шаарддаг програмуудад тохиромжтой болгодог. 30+ хэл дээр 100+ дуу хоолойтой Piper нь Raspberry Pi 4 дээр ч гэсэн бодит цаг хугацаанд байгалийн дуу авиаг хүргэдэг.
Хамгийн тохиромжтой: Хурдан урьдчилсан үзлэг, хүрэх боломж, хавтгайруулсан програмууд
Үнэгүй туршиж үзэх
VITS Free
VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) нь одоогийн хоёр шаттай загваруудаас илүү нарийн сонсогдох дууг гаргаж авах параллель төгсгөлөөс төгсгөл хүртэлх TTS арга юм. Энэ нь хэвийн урсгал болон өрсөлдөгч сургалтын үйл явцаар сайжруулсан variation inference- ийг ашиглан, нарийн сонсогдох байдлыг ихээхэн сайжруулдаг.
Хамгийн тохиромжтой: Нийгмийн зорилготой, байгалийн хэмнэлтэй текст- рүү- яриаName
Үнэгүй туршиж үзэх
MeloTTS Free
MyShell. ai- ийн MeloTTS нь олон хэлний TTS library бөгөөд Англи (Америк, Британ, Энэтхэг, Австрали), Испани, Франц, Хятад, Япон, Солонгос хэлийг дэмждэг. Энэ нь маш хурдан, зөвхөн CPU- ийн хурдаар текстийг бодит цаг хугацаанд нь боловсруулдаг. MeloTTS нь үйлдвэрлэлийн хэрэглээнд зориулагдсан бөгөөд CPU болон GPU- ийн дүгнэлтийг дэмждэг.
Хамгийн тохиромжтой: Шууд, олон хэлний TTS шаардсан үйлдвэрлэлийн програмууд
Үнэгүй туршиж үзэх
OuteTTS Free
OuteTTS нь эхний загварыг хадгалж, текстээс яриа болгох чадвартай том хэлний загварыг өргөжүүлдэг. Энэ нь llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, мөн Transformers. js-ийн браузерын дүгнэлтийг дэмждэг. JSON-оор хадгалагдсан дуут профайлуудыг ашиглан дууны клонлолтыг нууцаар хийдэг.
Хамгийн тохиромжтой: Edge-ийн суурилуулалт, вэб хөтөч дээр суурилсан TTS, бага нөөцтэй орчинд
Үнэгүй туршиж үзэх
Pocket TTS Free
Kyutai (Moshi- ийн зохиогчид) - ийн Pocket TTS нь 100М параметртэй, хэмнэлттэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметр
Хамгийн тохиромжтой: Хөнгөн суурилуулалт, CPU-ийн хэрэглээ багатай орчинд, дууны хурдан дуурайлт
Үнэгүй туршиж үзэх
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Хамгийн тохиромжтой: Fast lightweight TTS, edge deployment, low-latency applications
Үнэгүй туршиж үзэх
Bark Standard
Трансформатор дээр суурилсан текстээс дууны загвар нь бодит яриа, хөгжим, дууны эффектүүдийг үүсгэдэг. Name
Хөгжүүлэгч: Suno · Лиценз: MIT
оролдож үз
Bark Small Standard
Барк-ийн илүү хурдан тооцоолол, бага санах ой ашиглах боломжтой хувилбар. Name
Хөгжүүлэгч: Suno · Лиценз: MIT
оролдож үз
CosyVoice 2 Standard
Alibaba-ийн хэмжээст дамжуулах TTS нь хүний-паритын байгалийн байдал болон нууцлалын ойролцоо.
Хөгжүүлэгч: Alibaba (Tongyi Lab) · Лиценз: Apache 2.0
оролдож үз
Dia TTS Standard
Олон дуут ярианы генератор нь дуут ярианууд хооронд байгалийн яриаг бий болгодог.
Хөгжүүлэгч: Nari Labs · Лиценз: Apache 2.0
оролдож үз
Parler TTS Standard
Та хүссэн дуу хоолойгоо байгалийн хэлээрээ тодорхойл, Parler тохирох дуу хоолойг үүсгэнэ.
Хөгжүүлэгч: Hugging Face · Лиценз: Apache 2.0
оролдож үз
GLM-TTS Standard
Нээлттэй эхийн TTS загваруудын дунд хамгийн бага үсгийн алдааны түвшинг хангана.
Хөгжүүлэгч: Zhipu AI · Лиценз: GLM-4 License
оролдож үз
IndexTTS-2 Standard
Zero-shot TTS, нарийн мэдрэмжтэй, өндөр илэрхийлэлтэй.
Хөгжүүлэгч: Index Team · Лиценз: Bilibili Model License
оролдож үз
Spark TTS Standard
ТТС-ийн дууны клоныг удирдах сэтгэл хөдлөл болон дуудлагаар ярих хэв маяг.
Хөгжүүлэгч: SparkAudio · Лиценз: CC BY-NC-SA 4.0
оролдож үз
GPT-SoVITS Standard
5 секундын аудионоос ямар ч дууг репликацилах хэдхэн секундын дууны клонинг TTS.
Хөгжүүлэгч: RVC-Boss · Лиценз: MIT
оролдож үз
Orpheus Standard
Хүний түвшний сэтгэл хөдлөлийн TTS загварыг 100K цагийн ярианы мэдээллээр бэлтгэсэн.
Хөгжүүлэгч: Canopy Labs · Лиценз: Llama 3.2 Community
оролдож үз
Qwen3 TTS Standard
Alibaba-ийн олон хэлний TTS дууны клончлол, урьдчилан тохируулсан дуунууд, текстээс дууны загварыг дэмждэг.
Хөгжүүлэгч: Alibaba (Qwen) · Лиценз: Apache 2.0
оролдож үз
Chatterbox Turbo Standard
200мс-ийн доод хугацаатай, инээмсэглэх, ханиалгах, гэх мэт үгсийг тэмдэглэх паралингвист хэмжүүртэй хурдан Чатбокс.
Хөгжүүлэгч: Resemble AI · Лиценз: MIT
оролдож үз
Dia 2 Standard
Олон дуут яриа болон паралингвистик дохио бүхий анхны ярианы TTS.
Хөгжүүлэгч: Nari Labs · Лиценз: Apache 2.0
оролдож үз
VoxCPM Standard
Токенизаторгүй TTS нь 44.1kHz аудиог агуулга мэдрэх параграфын тогтвортой байдалтай гаргадаг.
Хөгжүүлэгч: OpenBMB · Лиценз: Apache 2.0
оролдож үз
TADA Standard
0-халлюцинацитай текст-акуст хоёрдогч нийцүүлэлттэй TTS, харьцуулахад LLM TTS-ээс 5x хурдан.
Хөгжүүлэгч: Hume AI · Лиценз: MIT
оролдож үз
VibeVoice Standard
Microsoft загвар нь подкаст болон аудио ном зэрэг олон дуут контентын урт хэлбэрийн загвар юм.
Хөгжүүлэгч: Microsoft · Лиценз: MIT
оролдож үз
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Хөгжүүлэгч: Alibaba (FunAudioLLM) · Лиценз: Apache 2.0
оролдож үз
CosyVoice 2
Alibaba-ийн хэмжээст дамжуулах TTS нь хүний-паритын байгалийн байдал болон нууцлалын ойролцоо.
Хэл: en, zh, ja, ko, fr, de, it, es
Дуу
GLM-TTS
Нээлттэй эхийн TTS загваруудын дунд хамгийн бага үсгийн алдааны түвшинг хангана.
Хэл: en, zh
Дуу
Spark TTS
ТТС-ийн дууны клоныг удирдах сэтгэл хөдлөл болон дуудлагаар ярих хэв маяг.
Хэл: en, zh
Дуу
GPT-SoVITS
5 секундын аудионоос ямар ч дууг репликацилах хэдхэн секундын дууны клонинг TTS.
Хэл: en, zh, ja, ko
Дуу
Chatterbox
"Resemble AI"-ийн сэтгэл хөдлөлийн хяналттай, хамгийн сүүлийн үеийн дууны клон.
Хэл: en
Дуу
OpenVoice
Хэлний хэв маяг, сэтгэл хөдлөл, өнгө аясыг хянах боломж бүхий шууд дууны дугуйлан.
Хэл: en, zh, ja, ko, fr, de, es, it
Дуу
Qwen3 TTS
Alibaba-ийн олон хэлний TTS дууны клончлол, урьдчилан тохируулсан дуунууд, текстээс дууны загварыг дэмждэг.
Хэл: en, zh, ja, ko, de, fr, ru, pt, es, it
Дуу
Chatterbox Turbo
200мс-ийн доод хугацаатай, инээмсэглэх, ханиалгах, гэх мэт үгсийг тэмдэглэх паралингвист хэмжүүртэй хурдан Чатбокс.
Хэл: en
Дуу
VoxCPM
Токенизаторгүй TTS нь 44.1kHz аудиог агуулга мэдрэх параграфын тогтвортой байдалтай гаргадаг.
Хэл: en, zh
Дуу
OuteTTS
LLM-ийн суурилсан TTS нь CPU, GPU, эсвэл llama.cpp болон Transformers.js-ийн браузер дээр ажилладаг.
Хэл: en
Дуу
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Хэл: en, zh, ja, ko, de, es, fr, it, ru
Дуу
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Хэл: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Дуу
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Хэл: en, zh
ДууХөгжүүлэгчдийн API
OpenAI-тэй нийцтэй REST API. Нэг төгсгөлийн цэг, 22+ загвар. Үнэн цагийн програмуудыг дамжуулах дэмжлэг.
- OpenAI-тай нийцсэн хэв маяг
- Орчин үеийн програмуудад зориулсан TTS дамжуулалт
- том ажлуудыг багцлан боловсруулна
- ТохиргооComment
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Зөвхөн, нээлттэй үнэлгээ
Үнэгүй эхлэх. Өсөх тусам өргөжүүлэх.
Чөлөөт
15 кредит
- Kokoro, Piper, VITS, MeloTTS
- 500 тэмдэгтийн хязгаар
- 3 ген/цаг (тооцоогүй)
Про
2,000 кредит
- Эхлүүлэгч дэх бүх зүйл
- API нэвтрэх
- Хамгийн түрүүнд боловсруул
Ажлын байр
10,000 кредит
- Про- гийн бүх зүйл
- Бүтээлийн API
- Дээд зэрэглэлийн дараалал
Заримдаа асуудаг асуултууд
Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.
Өнөөдөр AI дуугаралт ашиглах
TTS.ai-ийг ашигладаг зохиогчид, хөгжүүлэгчид, бизнесүүдтэй нэгдээрэй