Free AI Àkọlé sí Àkọ́kọ́
33+ àwọn ìṣàmúlò-ètò ìṣàfihàn, 273+ àwọn àwòrán, 33+ Àwọn ìtàn. Kò ní àwọn àwọn kàǹàdíẹ̀.
Gbogbo ohun ti o nilo fun AI Ìrọ̀
30+ àwọn ìrísí-lẹ́tà láti inú àwọn ìṣàmúlò-ètò AI tí a ṣí
33+ Àwọn ìṣàmúlò-ètò àwòrán
Àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Kokoro Àìfẹ́
Kokoro ní móòdù àkọlé-si-ìbàlẹ̀ àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Ó dara jù fún: TTS ìṣàmúlò-ètò ìṣàfilọ́lẹ̀ tí a bá fi àwọn ìṣàmúlò-ètò ìṣàfilọ́lẹ̀ pamọ́
Wá
Piper Àìfẹ́
Piper ní inú iṣẹ́ àkọlé-si-ìbàlẹ̀ tí Rhasspy tí lo VITS atí larynx architectures. Ò rọ́ọ̀nù ní pàtó nípa CPU, tí o fi jẹ́ ìṣàfarawésókè fún àwọn àpá-ìṣàmúlò-ètò, ìṣàfihàn ilé, àtí àwọn ìṣàmúlò-ètò tí fẹ́ TTS tí kò bá jẹ́ nípa intanẹ́ẹ̀tì. Nínú àwọn ìraǹrọ̀ 100 lọ́wọ́lọ́wọ́ nínú àwọn ìtàn 30+ ni Piper ǹfi àwọn àkọlé tí a tí ìgbá tí a tí ǹṣè gbọ̀ nínú àwọn ìṣàfihàn tí a tí ǹṣè nínú Raspberry Pi 4.
Ó dara jù fún: Àwọn ìṣàfihàn ìtàn, ìrànwọ́, àti àwọn ìṣàmúlò-ètò àìdálẹ̀
Wá
VITS Àìfẹ́
VITS (Ìṣàfilọ́lẹ̀ Ìyatọ̀ láti inú ìmọ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ fún àkọlé-si-ìbàlẹ̀-si-ìbàlẹ̀) ní àwọn ìṣàfilọ́lẹ̀ TTS ìsàlẹ̀ fún ìsàlẹ̀ tí wọ́n mú àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Ó dara jù fún: Àkọlé-si-ìgbàyélú-ìgbàyélú-ìgbàyélú-ìgbàyélú-ìgbàyélú-ìgbàyélú-ìgbàyélú
Wá
MeloTTS Àìfẹ́
MeloTTS láti MyShell.ai ní àwọn láìbòójútó TTS tí wọ́n gbọ́dọ̀ sílẹ̀ nínú àwọn ìtàn mìíràn tí wọ́n gbọ́dọ̀ sílẹ̀ nínú Àwọn Àkọsílẹ̀ (Ameríka, British, Indian, Australia), Sẹ́fànì, Fẹ́rẹ̀sì, Chinese, Japanese, àti Korean. O jẹ́ ìráwọ́lẹ̀, ìṣàfarawé àwọn àkọsílẹ̀ nínú ìráwọ́lẹ̀ àwọn àkókò nínú CPU. MeloTTS tí a ṣè fún ìlòòròrò àti ìṣàfarawé CPU àti GPU.
Ó dara jù fún: Àwọn ìṣàmúlò-ètò ìṣàmúlò-ètò tí fẹ́ ìṣàmúlò-ètò TTS àìpẹ̀, àwọn ìṣàmúlò-ètò mìíràn
Wá
Kani TTS 2 Àìfẹ́
Kani-TTS-2 nipasẹ NineNineSix jẹ awoṣe parameter 400M ti o ni iwuwo ina ti a ṣe lori backbone AI LFM2 ti o ni omi pẹlu NVIDIA NanoCodec. O n ṣiṣẹ ni 3GB VRAM nikan ati pe o ṣe ~10 sekondi ti ọrọ ni ~2 sekondi lori A100 (RTF 0.2). Iṣẹṣẹ ti o wa ni gbangba ti gbe ni English-kan `kani-tts-2-en` checkpoint ati pe ko fi ifihan han si isẹpo-iṣatunkọ-iṣatunkọ ti o nilo fun iṣilọ-isẹpo - lo Chatterbox / IndexTTS2 / F5-TTS fun iṣilọ, tabi Kokoro / MeloTTS fun ti kii ṣe English.
Ó dara jù fún: Àwọn ìṣàfilọ́lẹ̀ ìtàn Ingẹ̀lì láti inú àwọn ìṣàfilọ́lẹ̀ VRAM tí o gàjú, àwọn ìṣàfilọ́lẹ̀ ìtàn
Wá
OuteTTS Àìfẹ́
OuteTTS n ṣàfihàn àwọn módè́lì ìraǹrọ̀ nlà láti inú àwọn ìpéwọ̀n àkọ́lé-si-ìbálẹ̀ nígbà tí o ǹpárá àwọn ààyè orílẹ̀. O ǹfàyé àwọn ààyè ìsàlẹ̀ àwọn ìṣàfihàn lọ́wọ́lọ́wọ́ àti àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Ó dara jù fún: Ìṣàfilọ́lẹ̀ Ègè, TTS ìdájú ìṣàfilọ́lẹ̀, àwọn ìwọ̀n àwọn ààyè-iṣẹ́ ìsàlẹ̀-ilà kéré
Wá
Pocket TTS Àìfẹ́
Pocket TTS láti Kyutai (àwọn ìṣàfilọ́lẹ̀ Moshi) ní módè́lì àkọ́lé-si-ìbàlẹ̀ àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn à
Ó dara jù fún: Ìṣàfilọ́lẹ̀ àìpẹ̀, àwọn ìwọ̀n CPU-kéré, ìṣàfarawé àwòrán láàyè-iṣẹ́
Wá
Kitten TTS Àìfẹ́
Kitten TTS láti inú KittenML ní móòdù àkọlé-si-ìbàlẹ̀ tí a kọ̀ nípa ONNX. Ní àwọn ìṣàfarawe-ìtàn láti inú àwọn àwọn ààtòjọ-ẹ̀yàn 15M sí 80M (25-80 MB nínú disiki), ò ǹfí ìbàlẹ̀ ìṣàfarawe-ìbàlẹ̀ ìṣàfarawe-ìbàlẹ̀ ìṣàfarawe-ìbàlẹ̀ ìṣàfarawe-ìbàlẹ̀ àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn à
Ó dara jù fún: TTS tí o lágbará, ìṣàfihàn ààyè-iṣẹ́ tí o ní ìdálẹ̀, àwọn ìṣàmúlò-ètò tí o ní ìdálẹ̀ kéré
Wá
Ming-Omni TTS Àìfẹ́
Ming-omni-tts-0.5B nipasẹ inclusionAI jẹ awoṣe ọrọ omni-modali ti a ṣe ni BailingMM ti o ni irọra pẹlu dekoder orin ti o ni irọra ti o ni irọra. O pese iwọle 44.1kHz (ni ibiti o ti CD didara), ṣe atilẹyin ikojọpọ ọrọ-isẹ-ọkan lati itọkasi 3+ keji, ati pe o ni igbẹkẹle ninu ifẹ / ede / iṣakoso BGM nipasẹ awọn itọnisọna JSON. Iduroṣinṣin to dara - 0.83% WER lori awọn itọkasi Chinese.
Ó dara jù fún: Ìṣàfihàn àwọn ìtàn mejì tí a fi hàn, àwọn àwòrán àwọn àwòrán, àwọn àkọlé àwọn àkọlé Chinese
Wá
MOSS-TTS Nano Àìfẹ́
MOSS-TTS-Nano-100M ní ìṣàfarawe-parámetrù 100M tí a fi pamọ́ tí OpenMOSS tí jẹ́ ẹ̀yàn MOSS-TTS, tí o bá gbọ́dọ̀ kọ́ọ̀kan àwọn ìṣàfarawe-ìgbà. Ò ǹfí ìdáráwọ́ ìṣàmúlò-ètò 8B̀ pamọ́ fún àwọn àwọn ìpàpọ̀lù tí o kù jú 80x lọ, àti VRAM tí o kù jú àwọn ìṣàfihàn-ìgbègbè lọ, tí ò fi hàn pé ò lè lò fún àwọn ìṣàfihàn tí a fi pamọ́ atì tí a fi pamọ́ jú. Ò lè gbà 20-àkàn-àwọn ìṣàfihàn.
Ó dara jù fún: TTS tí a fi pamọ́, ìṣàfilọ́lẹ̀ ìpele-òkè, ìlò àìdáràn-ìgbà
Wá
Bark Àwọn ìpéwọ̀n
Módélù àkọ́lé-si-àwòrán tí a dá lorí ìṣàfarawé-ìṣàfilọ́lẹ̀ tí n ṣẹ̀dá àwọn àwọn ìṣàfilọ́lẹ̀ ìṣàfarawé, àwọn ìṣàfilọ́lẹ̀ ìranlọwọ, àwọn ìṣàfilọ́lẹ̀ ìgbọ́.
Alábòójútó: Suno · Àwọn Àmì-ìwé: MIT
Wòyé
Bark Small Àwọn ìpéwọ̀n
Àwọn ìṣàfarawégbèsì tí o ní ìṣàfarawégbèsì tí o lagbarà àti ìlòòròròrò.
Alábòójútó: Suno · Àwọn Àmì-ìwé: MIT
Wòyé
CosyVoice 2 Àwọn ìpéwọ̀n
TTS ti a le ṣii ti Alibaba pẹlu ifẹ-ara ẹni ati igbẹkẹle ti ko ni ifẹ.
Alábòójútó: Alibaba (Tongyi Lab) · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
Dia TTS Àwọn ìpéwọ̀n
Módélù ìṣàfilọ́lẹ̀ àgbèkalẹ̀ àwọn ìgbàkọ́-àgbèkalẹ̀-àgbèkalẹ̀ tí n ṣẹ́dá àwọn àgbèkalẹ̀ ìṣàfilọ́lẹ̀ àwọn ìgbàkalẹ̀.
Alábòójútó: Nari Labs · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
Parler TTS Àwọn ìpéwọ̀n
Fi àwòrán àwòrán tí o fẹ̀ pamọ́ sínú ìṣàfarawe-ìrọ̀ tí a tì kọ̀ nínú ìṣàfarawe-ìrọ̀ tí a tì kọ̀.
Alábòójútó: Hugging Face · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
IndexTTS-2 Àwọn ìpéwọ̀n
TTS tí a fi pamọ́ nípa ìdárawọ́lẹ̀ àti ìṣàfihàn giga.
Alábòójútó: Index Team · Àwọn Àmì-ìwé: Bilibili Model License
Wòyé
Spark TTS Àwọn ìpéwọ̀n
Ìṣàfarawe-ìrọ̀ TTS pẹlú àwọn ìrànwọ́ tí a lè ṣakoso àti àwọn ìṣàlàyé ìgbàgbọ́ láti inú àwọn àgbéwọlé.
Alábòójútó: SparkAudio · Àwọn Àmì-ìwé: CC BY-NC-SA 4.0
Wòyé
GPT-SoVITS Àwọn ìpéwọ̀n
Àwọn àwọn àwòrán-ìṣàmúlò-ètò TTS tí wọ́n ṣẹ̀dà àwọn àwòrán láti inú àwọn ìsẹ́ẹ̀tì 5.
Alábòójútó: RVC-Boss · Àwọn Àmì-ìwé: MIT
Wòyé
Orpheus Àwọn ìpéwọ̀n
Módélú TTS ìrànwọ́ ìrànwọ́-ìbàlẹ̀-ẹnì tí a kọ̀ nípa àwọn aago 100K tí àwọn ààtò ìsàlẹ̀-ilà ìsàlẹ̀-ilà.
Alábòójútó: Canopy Labs · Àwọn Àmì-ìwé: Llama 3.2 Community
Wòyé
Qwen3 TTS Àwọn ìpéwọ̀n
TTS tí a fi hàn nípa àwọn ìtàn mìíràn ti Alibaba ní àwọn ìrànwọ́ àti àwọn ìṣàfarawé ìtàn láti inú àkọlé.
Alábòójútó: Alibaba (Qwen) · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
VieNeu-TTS-v2 Àwọn ìpéwọ̀n
Vietnam + English TTS tí a fi àwọn àmì-ìwé àwọn àwòrán-ìṣàfilọ́lẹ̀ 7 pamọ́ nípa ìṣàfarawé àwọn àwòrán. CPU-kè ní, kò ní GPU tí a fẹ́.
Alábòójútó: Phạm Nguyễn Ngọc Bảo · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
Chatterbox Turbo Àwọn ìpéwọ̀n
Chatterbox tí ò kù jù lọ nípa ìdáràn-200ms àti àwọn àmì-ìwé paralinguistic fún àwọn ẹ̀yàn, àwọn ẹ̀yàn, àti àwọn mìíràn.
Alábòójútó: Resemble AI · Àwọn Àmì-ìwé: MIT
Wòyé
VoxCPM Àwọn ìpéwọ̀n
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
Alábòójútó: OpenBMB · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
VibeVoice Àwọn ìpéwọ̀n
Móòdù Microsoft fún àwọn ààyè-iṣẹ́ ìṣàfilọ́lẹ̀-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ-àpẹẹrẹ
Alábòójútó: Microsoft · Àwọn Àmì-ìwé: MIT
Wòyé
CosyVoice3 Àwọn ìpéwọ̀n
TTS tí a fi hàn nípa àwọn ìtàn mìíràn nípa ìṣàfilọ́lẹ̀, ìdárawọ́, àti ìṣàfilọ́lẹ̀ àwọn àwòrán.
Alábòójútó: Alibaba (FunAudioLLM) · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
NAMAA Saudi TTS Àwọn ìpéwọ̀n
Ṣí TTS Saudi-Arabic akọkọ. Diẹ̀lì Saudì náà láti inú ìṣàfarawé àwọn ìròyìn àwọn ìròyìn-àwọn ìṣàfilọ́lẹ̀.
Alábòójútó: NAMAA Space · Àwọn Àmì-ìwé: MIT
Wòyé
Darwin TTS Àwọn ìpéwọ̀n
Cross-modal Qwen3-TTS variant pẹlu awọn iwuwo FFN ti a ṣe ni iṣọkan lati Qwen3-1.7B aṣa ede fun awọn iṣọkan ti o ni igbẹkẹle.
Alábòójútó: FINAL-Bench · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
MOSS-TTSD Àwọn ìpéwọ̀n
Multi-speaker dialogue continuation model — gbe awọn ibaraẹnisọrọ aṣa-podcast ranṣẹ pẹlu awọn olugbagbọ 5 ati awọn iṣẹju 60 ti awọn ohun orin ti o ni ibatan.
Alábòójútó: OpenMOSS · Àwọn Àmì-ìwé: Apache 2.0
Wòyé
CosyVoice 2
TTS ti a le ṣii ti Alibaba pẹlu ifẹ-ara ẹni ati igbẹkẹle ti ko ni ifẹ.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh, ja, ko, fr, de, it, es
Àwọn Àmì-ìwé
IndexTTS-2
TTS tí a fi pamọ́ nípa ìdárawọ́lẹ̀ àti ìṣàfihàn giga.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh
Àwọn Àmì-ìwé
Spark TTS
Ìṣàfarawe-ìrọ̀ TTS pẹlú àwọn ìrànwọ́ tí a lè ṣakoso àti àwọn ìṣàlàyé ìgbàgbọ́ láti inú àwọn àgbéwọlé.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh
Àwọn Àmì-ìwé
GPT-SoVITS
Àwọn àwọn àwòrán-ìṣàmúlò-ètò TTS tí wọ́n ṣẹ̀dà àwọn àwòrán láti inú àwọn ìsẹ́ẹ̀tì 5.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh, ja, ko
Àwọn Àmì-ìwé
Chatterbox
Iṣàfilọ́lẹ̀ àwòrán tí kò ní ìṣàfilọ́lẹ̀ pẹ̀lú ìṣàfilọ́lẹ̀ ìrànwọ́ láti inú Resemble AI.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en
Àwọn Àmì-ìwé
Tortoise TTS
Àkọlé àwòrán-si-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀-ìrọ̀.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en
Àwọn Àmì-ìwé
OpenVoice
Ìṣàfarawé àwọn ìròyìn àwọn ìsàlẹ̀-ilà nípa ìdáràn àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh, ja, ko, fr, es
Àwọn Àmì-ìwé
VieNeu-TTS-v2
Vietnam + English TTS tí a fi àwọn àmì-ìwé àwọn àwòrán-ìṣàfilọ́lẹ̀ 7 pamọ́ nípa ìṣàfarawé àwọn àwòrán. CPU-kè ní, kò ní GPU tí a fẹ́.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn vi, en
Àwọn Àmì-ìwé
Chatterbox Turbo
Chatterbox tí ò kù jù lọ nípa ìdáràn-200ms àti àwọn àmì-ìwé paralinguistic fún àwọn ẹ̀yàn, àwọn ẹ̀yàn, àti àwọn mìíràn.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en
Àwọn Àmì-ìwé
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh
Àwọn Àmì-ìwé
OuteTTS
TTS LLM-da lori ti o nlọ lori CPU, GPU, tabi aṣawakiri nipasẹ llama.cpp ati Transformers.js.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en
Àwọn Àmì-ìwé
Pocket TTS
Àwọn àwọn ààyè-iṣẹ́ àwọn àwọn ààyè-iṣẹ́ 100M tí Kyutai fi pamọ́ láti inú àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, fr
Àwọn Àmì-ìwé
CosyVoice3
TTS tí a fi hàn nípa àwọn ìtàn mìíràn nípa ìṣàfilọ́lẹ̀, ìdárawọ́, àti ìṣàfilọ́lẹ̀ àwọn àwòrán.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh, ja, ko, de, es, fr, it, ru
Àwọn Àmì-ìwé
NAMAA Saudi TTS
Ṣí TTS Saudi-Arabic akọkọ. Diẹ̀lì Saudì náà láti inú ìṣàfarawé àwọn ìròyìn àwọn ìròyìn-àwọn ìṣàfilọ́lẹ̀.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn ar
Àwọn Àmì-ìwé
Darwin TTS
Cross-modal Qwen3-TTS variant pẹlu awọn iwuwo FFN ti a ṣe ni iṣọkan lati Qwen3-1.7B aṣa ede fun awọn iṣọkan ti o ni igbẹkẹle.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, ko, ja, zh
Àwọn Àmì-ìwé
MOSS-TTSD
Multi-speaker dialogue continuation model — gbe awọn ibaraẹnisọrọ aṣa-podcast ranṣẹ pẹlu awọn olugbagbọ 5 ati awọn iṣẹju 60 ti awọn ohun orin ti o ni ibatan.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh
Àwọn Àmì-ìwé
Ming-Omni TTS
Compact 0.5B omni-modal ọrọ awoṣe lati inclusionAI pẹlu giga-fidelity 44.1kHz output ati zero-shot ọrọ kloning.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh
Àwọn Àmì-ìwé
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — kanna architecture, 80x kekere, free-tier latency.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Àwọn Àmì-ìwéÀwọn Àwọn Àkọlé
API REST tí a bá fẹ́ OpenAI. Ààyè kejì, àwọn àwọn àwòrán 22+. Àwọn ìṣàmúlò-ètò ìṣàfihàn-àwọn.
- Ìgúnrégé tí a bá fẹ́
- Ìṣàfilọ́lẹ̀ TTS fún àwọn ìṣàmúlò-ètò ìtàn
- Ìṣàmúlò-ètò àwọn iṣẹ́ nlà
- Àwọn ìsàlẹ̀-ilà Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Àwọn Ìṣàmúlò-ètò
Bẹ́ẹ̀nì. Ṣẹ̀dà bí o tí wúlò.
Àìfihàn
15,000 àwọn àmì-àṣírí + 5,000/ọ̀jọ̀
- Àwọn àwòrán 7 tí a fi Kokoro pamọ́
- Àwọn àmì-ìwé 5,000 fún ìṣàfihàn kan
- Àwọn ìṣàfihàn API tí a fi kun
Àwọn Ìṣàmúlò-ètò
500,000 àwọn àmì-ìwé/oṣu
- Gbogbo àwọn àwòrán 22+
- 100,000 àwọn àmì-àṣírí fún ìṣàfarawé
- Àwọn Àmì-ìwé
Àwọn Àwọn Àwọn
2,000,000 àwọn àmì-ìwé/oṣu
- Gbogbo àwòrán nínú Aṣàfilọ́lẹ̀
- Ààyè-iṣẹ́ API
- Àwọn Ìṣàmúlò-ètò
Àwọn iṣẹ́
10,000,000 àwọn àmì-ìwé/oṣu
- Ohun gbogbo nínú Pro
- Aṣàfilọ́lẹ̀ API
- Àwọn ìṣàmúlò-ètò
Wó àwọn àwọn ìṣàmúlò-ètò láti inú àwọn àwọn àwọn àmì-ìwé →
Àwọn Àtòjọ-ẹ̀yàn
Àwọn àwọn àgbéwọlé rẹ̀ lè jẹ́ ìrànwọ́ fún wa.
Ṣí Lòkùtà AI
Ṣàfikún àwọn oludasile, àwọn ìṣàfilọ́lẹ̀, àti àwọn ile-iṣẹ́ nípa ìlò TTS.ai