Чөлөөт AI Үгнээс үсэг рүүName

33+ нээлттэй эхийн загварууд, 273+ дуунууд, 33+ Тоглоомын нэр:

17K+
зохиогчид
70K+
үе шат
33+
AI загварууд
273+
дуунууд
0/500 тэмдэгт · 5000-аар бүртгүүлэх → Чөлөөт
TTS.ai-г хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Таны дууны AI-д хэрэгтэй бүх зүйлName

30+ хэрэгслийг нээлттэй эхийн хиймэл оюун ухааны загвараар хангана

33+ AI дууны загвар

Нэг платформд хамгийн өргөн хүрээтэй нээлттэй эхийн TTS загварууд

KokoroKokoro Хязгааргүй

Kokoro нь 82 сая параметртэй, өөрийн жингийн ангилалд багтах чадвартай текст- рүү- яриа загвар юм. Энэ нь жижигхэн боловч, гайхалтай, илэрхийлэлтэй яриаг гаргаж өгдөг. Kokoro нь Англи, Япон, Хятад, Солонгос зэрэг олон хэлийг дэмждэг бөгөөд олон янзын илэрхийлэлтэй дуу хоолойг гаргаж өгдөг. Энэ нь маш хурдан ажилладаг - график процессор дээрх бодит цагаасаа 100 дахин хурдан дуу үүсгэдэг.

Хамгийн тохиромжтой: Хамгийн бага хугацаа шаардсан чанартай TTS, шууд дамжуулах програмууд

Үнэгүй туршиж үзэх

PiperPiper Хязгааргүй

Piper бол Rhasspy- ийн боловсруулсан VITS болон larynx архитектуруудыг ашигласан хөнгөн жинтэй текст- рүү- яриа хөдөлгүүр юм. Энэ нь бүхэлдээ CPU дээр ажилладаг, үүнийг edge төхөөрөмжүүд, гэр ахуйн автоматжуулалт, болон холбоогүй TTS шаарддаг програмуудад тохиромжтой болгодог. 30+ хэл дээр 100+ дуу хоолойтой Piper нь Raspberry Pi 4 дээр ч гэсэн бодит цаг хугацаанд байгалийн дуу авиаг хүргэдэг.

Хамгийн тохиромжтой: Хурдан урьдчилсан үзлэг, хүрэх боломж, хавтгайруулсан програмууд

Үнэгүй туршиж үзэх

VITSVITS Хязгааргүй

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) нь одоогийн хоёр шаттай загваруудаас илүү нарийн сонсогдох дууг гаргаж авах параллель төгсгөлөөс төгсгөл хүртэлх TTS арга юм. Энэ нь хэвийн урсгал болон өрсөлдөгч сургалтын үйл явцаар сайжруулсан variation inference- ийг ашиглан, нарийн сонсогдох байдлыг ихээхэн сайжруулдаг.

Хамгийн тохиромжтой: Нийгмийн зорилготой, байгалийн хэмнэлтэй текст- рүү- яриаName

Үнэгүй туршиж үзэх

MeloTTSMeloTTS Хязгааргүй

MyShell. ai- ийн MeloTTS нь олон хэлний TTS library бөгөөд Англи (Америк, Британ, Энэтхэг, Австрали), Испани, Франц, Хятад, Япон, Солонгос хэлийг дэмждэг. Энэ нь маш хурдан, зөвхөн CPU- ийн хурдаар текстийг бодит цаг хугацаанд нь боловсруулдаг. MeloTTS нь үйлдвэрлэлийн хэрэглээнд зориулагдсан бөгөөд CPU болон GPU- ийн дүгнэлтийг дэмждэг.

Хамгийн тохиромжтой: Шууд, олон хэлний TTS шаардсан үйлдвэрлэлийн програмууд

Үнэгүй туршиж үзэх

Kani TTS 2Kani TTS 2 Хязгааргүй

Kani- TTS- 2 by NineNineSix нь NVIDIA NanoCodec- тэй Liquid AI LFM2 backbone дээр суурилсан 400M параметртэй маш хөнгөн жинтэй загвар юм. Энэ нь 3GB VRAM- ээр ажилладаг бөгөөд A100 (RTF 0. 2) дээр ~2 секундэд ~10 секундын яриа гаргадаг. Одоогийн нийтийн хувилбар нь зөвхөн Англи хэлний `kani- tts- 2- en` шалгах цэгтэй бөгөөд дууны клонлоход шаардлагатай дуут дохиог илрүүлэх боломжгүй — клонлоход Chatterbox / IndexTTS2 / F5- TTS, Англи хэлгүй бол Kokoro / MeloTTS ашиглана.

Хамгийн тохиромжтой: Хэт бага VRAM-тай тоног төхөөрөмж дээр хурдан Англи хэл үүсгэх, хурдан урьдчилсан үзлэг

Үнэгүй туршиж үзэх

OuteTTSOuteTTS Хязгааргүй

OuteTTS нь эхний загварыг хадгалж, текстээс яриа болгох чадвартай том хэлний загварыг өргөжүүлдэг. Энэ нь llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, мөн Transformers. js-ийн браузерын дүгнэлтийг дэмждэг. JSON-оор хадгалагдсан дуут профайлуудыг ашиглан дууны клонлолтыг нууцаар хийдэг.

Хамгийн тохиромжтой: Edge-ийн суурилуулалт, вэб хөтөч дээр суурилсан TTS, бага нөөцтэй орчинд

Үнэгүй туршиж үзэх

Pocket TTSPocket TTS Хязгааргүй

Kyutai (Moshi- ийн зохиогчид) - ийн Pocket TTS нь 100М параметртэй, хэмнэлттэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметртэй, 100М параметр

Хамгийн тохиромжтой: Хөнгөн суурилуулалт, CPU-ийн хэрэглээ багатай орчинд, дууны хурдан дуурайлт

Үнэгүй туршиж үзэх

Kitten TTSKitten TTS Хязгааргүй

Kitten TTS by KittenML нь ONNX дээр суурилсан маш хөнгөн жинтэй текстээс яриа болгох загвар юм. 15M- 80M параметртэй (25- 80 MB дискэнд), GPU шаардахгүйгээр CPU дээр өндөр чанартай яриа синтезийг хүргэдэг. 8 доторх дуу, ярианы хурд тохируулах, тоо, мөнгө, нэгжүүдийн доторх текстийн урьдчилсан боловсруулалт. Edge- ийн суурилуулалт болон бага хугацаа шаардсан програмуудад тохиромжтой.

Хамгийн тохиромжтой: Хурдан, хөнгөн TTS, талын байршуулах, бага хугацаа шаардсан програмууд

Үнэгүй туршиж үзэх

Ming-Omni TTSMing-Omni TTS Хязгааргүй

InclusionAI- ийн Ming- omni- tts- 0. 5B нь BailingMM-ийн нягт нямбай суурь дээр суурилсан, Patch- by- Patch-ийн урсгал тохирох аудио кодлогчтой, компакт omni-modal ярианы загвар юм. 44. 1kHz-ийн (CD чанартай) гаралт, 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секундын 3+ секунд

Хамгийн тохиромжтой: Дуу бичлэгийн чанар өндөр, сэтгэл хөдлөл удирдсан дууны найруулга, хятад дуут номын агуулга

Үнэгүй туршиж үзэх

MOSS-TTS NanoMOSS-TTS Nano Хязгааргүй

MOSS- TTS- Nano- 100M нь MOSS- TTS гэр бүлийн OpenMOSS-ийн компакт 100M-параметр хувилбар бөгөөд, саад- трансформаторын архитектурыг хуваалцдаг. 8B загварын дээд чанарыг ~80x бага жинтэй, хүссэн бүрт бага VRAM-тай солилцдог, энэ нь чөлөөт түвшний болон өндөр дамжуулалтын ашиглалтад тохиромжтой. 20 хэлний хүрээтэй.

Хамгийн тохиромжтой: Хязгааргүй түвшний TTS, өндөр хэмжээтэй үйлдвэрлэл, бага хугацааны хүлээлттэй интерактив хэрэглээ

Үнэгүй туршиж үзэх

BarkBark Стандарт

Трансформатор дээр суурилсан текстээс дууны загвар нь бодит яриа, хөгжим, дууны эффектүүдийг үүсгэдэг. Name

Хөгжүүлэгч: Suno · Лиценз: MIT

оролдож үз

Bark SmallBark Small Стандарт

Барк-ийн илүү хурдан тооцоолол, бага санах ой ашиглах боломжтой хувилбар. Name

Хөгжүүлэгч: Suno · Лиценз: MIT

оролдож үз

CosyVoice 2CosyVoice 2 Стандарт

Alibaba-ийн хэмжээст дамжуулах TTS нь хүний-паритын байгалийн байдал болон нууцлалын ойролцоо.

Хөгжүүлэгч: Alibaba (Tongyi Lab) · Лиценз: Apache 2.0

оролдож үз

Dia TTSDia TTS Стандарт

Олон дуут ярианы генератор нь дуут ярианууд хооронд байгалийн яриаг бий болгодог.

Хөгжүүлэгч: Nari Labs · Лиценз: Apache 2.0

оролдож үз

Parler TTSParler TTS Стандарт

Та хүссэн дуу хоолойгоо байгалийн хэлээрээ тодорхойл, Parler тохирох дуу хоолойг үүсгэнэ.

Хөгжүүлэгч: Hugging Face · Лиценз: Apache 2.0

оролдож үз

IndexTTS-2IndexTTS-2 Стандарт

Zero-shot TTS, нарийн мэдрэмжтэй, өндөр илэрхийлэлтэй.

Хөгжүүлэгч: Index Team · Лиценз: Bilibili Model License

оролдож үз

Spark TTSSpark TTS Стандарт

ТТС-ийн дууны клоныг удирдах сэтгэл хөдлөл болон дуудлагаар ярих хэв маяг.

Хөгжүүлэгч: SparkAudio · Лиценз: CC BY-NC-SA 4.0

оролдож үз

GPT-SoVITSGPT-SoVITS Стандарт

5 секундын аудионоос ямар ч дууг репликацилах хэдхэн секундын дууны клонинг TTS.

Хөгжүүлэгч: RVC-Boss · Лиценз: MIT

оролдож үз

OrpheusOrpheus Стандарт

Хүний түвшний сэтгэл хөдлөлийн TTS загварыг 100K цагийн ярианы мэдээллээр бэлтгэсэн.

Хөгжүүлэгч: Canopy Labs · Лиценз: Llama 3.2 Community

оролдож үз

Qwen3 TTSQwen3 TTS Стандарт

Alibaba-ийн олон хэлний TTS нь өмнөх тохируулсан дуунууд болон текстээс дууны загварыг агуулдаг.

Хөгжүүлэгч: Alibaba (Qwen) · Лиценз: Apache 2.0

оролдож үз

VieNeu-TTS-v2VieNeu-TTS-v2 Стандарт

Вьетнам + Англи код солих TTS 7-н өмнөх тохируулсан дуу хоолой, 0-р гүйдлийн дуу хоолойг дуурайх. CPU-ийн хэрэглээ, график процессор шаардахгүй. Name

Хөгжүүлэгч: Phạm Nguyễn Ngọc Bảo · Лиценз: Apache 2.0

оролдож үз

Chatterbox TurboChatterbox Turbo Стандарт

200мс-ийн доод хугацаатай, инээмсэглэх, ханиалгах, гэх мэт үгсийг тэмдэглэх паралингвист хэмжүүртэй хурдан Чатбокс.

Хөгжүүлэгч: Resemble AI · Лиценз: MIT

оролдож үз

VoxCPMVoxCPM Стандарт

Токенизаторгүй TTS нь 44.1kHz аудиог агуулга мэдрэх параграфын тогтвортой байдалтай гаргадаг.

Хөгжүүлэгч: OpenBMB · Лиценз: Apache 2.0

оролдож үз

VibeVoiceVibeVoice Стандарт

Microsoft загвар нь подкаст болон аудио ном зэрэг олон дуут контентын урт хэлбэрийн загвар юм.

Хөгжүүлэгч: Microsoft · Лиценз: MIT

оролдож үз

CosyVoice3CosyVoice3 Стандарт

Би-стриминг, сэтгэл хөдлөлийн хяналт, дууны клонлолтгүй олон хэлний дараагийн үеийн TTS.

Хөгжүүлэгч: Alibaba (FunAudioLLM) · Лиценз: Apache 2.0

оролдож үз

NAMAA Saudi TTSNAMAA Saudi TTS Стандарт

Саудын Арабын анхны нээлттэй TTS. Саудын Арабын үндэсний хэлний Chatterbox-ийн чанартай дууны клон.

Хөгжүүлэгч: NAMAA Space · Лиценз: MIT

оролдож үз

Darwin TTSDarwin TTS Стандарт

Cross-modal Qwen3-TTS хувилбар нь FFN жинтэй, Qwen3-1.7B хэлний загвараас илүү нарийвчлалтай олон хэлний клонлолт хийхэд тохиромжтой.

Хөгжүүлэгч: FINAL-Bench · Лиценз: Apache 2.0

оролдож үз

MOSS-TTSDMOSS-TTSD Стандарт

Олон дуут ярианы үргэлжлэх загвар -5гар утас болон 60 минутын нийцтэй аудиотой подкаст маягийн яриа үүсгэх.

Хөгжүүлэгч: OpenMOSS · Лиценз: Apache 2.0

оролдож үз

ChatterboxChatterbox Дээд зэрэглэлийн

"Resemble AI"-ийн сэтгэл хөдлөлийн хяналттай, хамгийн сүүлийн үеийн дууны клон.

Чадал:

оролдож үз

Tortoise TTSTortoise TTS Дээд зэрэглэлийн

Авторегрессив загвартай чанарт суурилсан олон дуут текст-то-сонголт.

Чадал:

оролдож үз

StyleTTS 2StyleTTS 2 Дээд зэрэглэлийн

Хүний түвшний текст-то-уламжлалт яриа, маргаантай сургалтын аргаар.

Чадал:

оролдож үз

OpenVoiceOpenVoice Дээд зэрэглэлийн

Хэлний хэв маяг, сэтгэл хөдлөл, өнгө аясыг хянах боломж бүхий шууд дууны дугуйлан.

Чадал:

оролдож үз

Sesame CSMSesame CSM Дээд зэрэглэлийн

Уулзалтын ярианы загвар нь тохирох цаг хугацаа, мэдрэмжтэй байгалийн яриаг бий болгодог.

Чадал:

оролдож үз

CosyVoice 2CosyVoice 2

Alibaba-ийн хэмжээст дамжуулах TTS нь хүний-паритын байгалийн байдал болон нууцлалын ойролцоо.

Хэл: en, zh, ja, ko, fr, de, it, es

Дуу

IndexTTS-2IndexTTS-2

Zero-shot TTS, нарийн мэдрэмжтэй, өндөр илэрхийлэлтэй.

Хэл: en, zh

Дуу

Spark TTSSpark TTS

ТТС-ийн дууны клоныг удирдах сэтгэл хөдлөл болон дуудлагаар ярих хэв маяг.

Хэл: en, zh

Дуу

GPT-SoVITSGPT-SoVITS

5 секундын аудионоос ямар ч дууг репликацилах хэдхэн секундын дууны клонинг TTS.

Хэл: en, zh, ja, ko

Дуу

ChatterboxChatterbox

"Resemble AI"-ийн сэтгэл хөдлөлийн хяналттай, хамгийн сүүлийн үеийн дууны клон.

Хэл: en

Дуу

Tortoise TTSTortoise TTS

Авторегрессив загвартай чанарт суурилсан олон дуут текст-то-сонголт.

Хэл: en

Дуу

OpenVoiceOpenVoice

Хэлний хэв маяг, сэтгэл хөдлөл, өнгө аясыг хянах боломж бүхий шууд дууны дугуйлан.

Хэл: en, zh, ja, ko, fr, es

Дуу

VieNeu-TTS-v2VieNeu-TTS-v2

Вьетнам + Англи код солих TTS 7-н өмнөх тохируулсан дуу хоолой, 0-р гүйдлийн дуу хоолойг дуурайх. CPU-ийн хэрэглээ, график процессор шаардахгүй. Name

Хэл: vi, en

Дуу

Chatterbox TurboChatterbox Turbo

200мс-ийн доод хугацаатай, инээмсэглэх, ханиалгах, гэх мэт үгсийг тэмдэглэх паралингвист хэмжүүртэй хурдан Чатбокс.

Хэл: en

Дуу

VoxCPMVoxCPM

Токенизаторгүй TTS нь 44.1kHz аудиог агуулга мэдрэх параграфын тогтвортой байдалтай гаргадаг.

Хэл: en, zh

Дуу

OuteTTSOuteTTS

LLM-ийн суурилсан TTS нь CPU, GPU, эсвэл llama.cpp болон Transformers.js-ийн браузер дээр ажилладаг.

Хэл: en

Дуу

Pocket TTSPocket TTS

Kyutai-ийн 100M параметрийн загвар, нэг жишээнээс дууны клонлолт. Name

Хэл: en, fr

Дуу

CosyVoice3CosyVoice3

Би-стриминг, сэтгэл хөдлөлийн хяналт, дууны клонлолтгүй олон хэлний дараагийн үеийн TTS.

Хэл: en, zh, ja, ko, de, es, fr, it, ru

Дуу

NAMAA Saudi TTSNAMAA Saudi TTS

Саудын Арабын анхны нээлттэй TTS. Саудын Арабын үндэсний хэлний Chatterbox-ийн чанартай дууны клон.

Хэл: ar

Дуу

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS хувилбар нь FFN жинтэй, Qwen3-1.7B хэлний загвараас илүү нарийвчлалтай олон хэлний клонлолт хийхэд тохиромжтой.

Хэл: en, ko, ja, zh

Дуу

MOSS-TTSDMOSS-TTSD

Олон дуут ярианы үргэлжлэх загвар -5гар утас болон 60 минутын нийцтэй аудиотой подкаст маягийн яриа үүсгэх.

Хэл: en, zh

Дуу

Ming-Omni TTSMing-Omni TTS

InclusionAI-ийн 0.5B олон модаль ярианы загвар, өндөр чанартай 44.1kHz-ийн гаралт, дууны 0-шот клончлол.

Хэл: en, zh

Дуу

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS хувилбар — ижил архитектур, 80x бага, чөлөөт түвшний тэсрэлт.

Хэл: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Дуу

Хөгжүүлэгчдийн API

OpenAI-тэй нийцтэй REST API. Нэг төгсгөлийн цэг, 22+ загвар. Үнэн цагийн програмуудыг дамжуулах дэмжлэг.

  • OpenAI-тай нийцсэн хэв маяг
  • Орчин үеийн програмуудад зориулсан TTS дамжуулалт
  • том ажлуудыг багцлан боловсруулна
  • ТохиргооComment
API баримтуудыг харах
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Зөвхөн, нээлттэй үнэлгээ

Үнэгүй эхлэх. Өсөх тусам өргөжүүлэх.

Чөлөөт

$0

15,000 тэмдэгт + 5,000/ өдөр

  • Кокорог багтаасан 7-н үнэгүй загвар
  • 5000 тэмдэгт нэг үе
  • API- ийн нэвтрэлт багтсан
Үнэгүй бүртгүүлэх

Эхлүүлэгч

$9/сар

500 кредит/сар

  • Бүх 22+ загвар
  • 100,000 тэмдэгт нэг үе
  • Хөгжүүлэгч
Эхлэх
Хамгийн алдартай

Про

$29/сар

2,000 кредит

  • Эхлүүлэгч дэх бүх зүйл
  • API нэвтрэх
  • Хамгийн түрүүнд боловсруул
Профессор

Ажлын байр

$99/сар

10,000 кредит

  • Про- гийн бүх зүйл
  • Бүтээлийн API
  • Дээд зэрэглэлийн дараалал
Ажлыг авах

Бүх төлөвлөгөөг дүрс багцуудыг багтаасан байдлаар харах →

Заримдаа асуудаг асуултууд

TTS.ai нь хамгийн бүрэн AI дуу хоолой платформ бөгөөд 22+ текст-мэдээлэл-хөгжүүлэгч загвар, дууны клон, дуу-мэдээлэл-хөгжүүлэгч, аудио хэрэгслүүдийг санал болгодог. Бүх загварууд нь нээлттэй эхийн програм бөгөөд үйлдвэрлэгчидтэй хамааралгүй.

Тийм ээ! TTS.ai нь Kokoro, Piper, VITS, болон MeloTTS загваруудтай үнэгүй текст-то-сонголт санал болгодог. Нууц үг шаардахгүй. 15,000 үнэгүй дүрсийг авахын тулд бүртгүүлээд бүх загваруудыг ашиглаарай. Үйлчилгээний төлбөр нь сар бүр $9.

Хурдтай бол Kokoro эсвэл Piper ашигла. чанартай бол CosyVoice 2 эсвэл StyleTTS 2 ашигла. дууны клонлолт хийхэд Chatterbox эсвэл GPT- SoVITS ашигла. ярианы хувьд Dia TTS ашигла. харьцуулахын тулд ижил текст дээр олон загваруудыг туршиж үз.

Тийм. OpenAI-тэй нийцтэй TTS, STT, дууны дугуйлан, аудио хэрэгслүүдийн REST API. Бүх төлөвлөгөөнд багтсан, үнэгүй, түвшингээр нэмэгдэх хурдны хязгаартай (Үнэгүй: 10 асуулт/минут, Жижиг: 20, Эхлэгч: 30, Про: 60, Бизнес: 300). Тусламжийн баримт бичгийг tts.ai/api/-с үзнэ үү.

Хөгжмийн чанар загвараас шалтгаалдаг. CosyVoice 2, StyleTTS 2, Chatterbox зэрэг үнэтэй загварууд нь хүнийхтэй ижил чанартай дуу авиаг гаргаж өгдөг. Kokoro гэх мэт үнэгүй загварууд нь ихэвчлэн маш сайн чанартай дуу авиаг гаргадаг.

TTS.ai нь 30+ хэлийг дэмждэг. Англи хэл хамгийн өргөн дэмжлэгтэй, гэхдээ CosyVoice 2 нь Хятад, Япон, Солонгос хэлийг дэмждэг; GPT- SoVITS нь Хятад, Япон, Солонгос, Англи хэлийг дэмждэг; MeloTTS нь Англи, Испани, Франц, Хятад, Япон, Солонгос хэлийг дэмждэг.

Тийм ээ. Бүх боловсруулалт нь бидний зориулсан график процессор дээр явагддаг. Бид таны бичлэгийн оруулалт, дууны бичлэгийг хадгалдаггүй. Дэлгэцийг дуурайхдаа оруулсан дууны жишээг зөвхөн энэ сеанст ашигладаг бөгөөд хадгалдаггүй. Бид таны мэдээллийг гуравдагч этгээдэд хэзээ ч хуваалцахгүй, мөн загварыг сургахдаа ч ашиглахгүй.

Тийм. TTS.ai-аар үүсгэгдсэн бүх дууг YouTube видео, подкаст, аудио ном, програм, зар сурталчилгаа, бүтээгдэхүүнд ашиглах боломжтой. Манай загварууд нь нээлттэй эхийн зөвшөөрөлтэй (MIT, Apache 2.0). Орлогын төлбөр, нэрийг дурдах шаардлагагүй.

TTS.ai нь хамгийн өндөр чанартай дууг WAV форматаар үүсгэдэг. Та MP3, FLAC, OGG, эсвэл M4A- рүү манай үнэгүй Аудио конвертерийг ашиглан хөрвүүлэх боломжтой. API нь хүссэн гаралтын форматаа шууд хүсэлтдээ заах боломжийг олгодог.

Клонлох дууныхаа богино хэмжээний аудио бичлэгийг (5 секундоос багагүй) татаж аваарай, дараа нь энэ дууг үүсгэхийн тулд хүссэн текстээ бичнэ үү. Chatterbox, GPT- SoVITS, CosyVoice 2-ийн загварууд дууны клонлолыг дэмждэг. Клонлагдсан дуу нь өнгө, өнгөлгөө, ярианы хэв маягийг агуулдаг.

Үнэгүй загварууд (Kokoro, Piper, VITS, MeloTTS) бүртгэл шаардахгүй бөгөөд тэмдэгт үнэгүй. Стандарт загварууд (2000 тэмдэгт/1K оруулалт) нь Bark, CosyVoice 2, F5-TTS, болон Dia. Үнэтэй загварууд (4000 тэмдэгт/1K оруулалт) нь OpenVoice, Chatterbox, StyleTTS 2, болон Tortoise. Үнэтэй загварууд нь ихэвчлэн илүү чанартай, илүү олон дуу хоолой, мөн дуу хоолойг дуурайх зэрэг нэмэлт шинж чанаруудыг санал болгодог.

Тийм. Энэ API нь их хэмжээний текстийг ярианд хөрвүүлэх багц боловсруулалтыг дэмждэг. Олон хүсэлт илгээнэ үү, ажлын UUID- ийг ашиглан үр дүнг асинхроноор олж авна. Бизнес төлөвлөгөө ($99/ сар) болон түүнээс дээш нь хурдан багц боловсруулалт хийхийн тулд нэн тэргүүний хүлээлтийг агуулдаг. Аудиокино, хичээлийн агуулга, том хэмжээний дуу оруулах төслүүдэд тохиромжтой.
4.1/5 (42)

Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.

Өнөөдөр AI дуугаралт ашиглах

TTS.ai-ийг ашигладаг зохиогчид, хөгжүүлэгчид, бизнесүүдтэй нэгдээрэй