ነጻ AI ጽሑፉን ወደ ንግግር ለውጥ

33+ ክፍት ምንጭ ሞዴሎች, 273+ ድምጾች 33+ ቋንቋዎች. የግልጽነት ያስፈልጋል

18K+
ፈጣሪዎች
72K+
ትውልዶች
33+
AI ሞዴሎች
273+
ድምጾች
ፊደላት ፊደላት የክሬዲት ካርድ የለም የኮሜርስ ጥቅም
ነጻ
ድምፅ ያውርዱ መገናኛ በ24 ሰዓት ውስጥ ይቋረጣል
TTS.aiን ወዳጅነት?

ለድምፅ AI የሚያስፈልግዎ ሁሉ

30+ መሣሪያዎች በነጻ ምንጭ AI ሞዴሎች የተገነቡ

33+ የድምፅ ሞዴሎች

በአንድ መድረክ ውስጥ የ TTS ሞዴሎችን በጣም የተሟላ ስብስብ

KokoroKokoro ነጻ

ኮኮሮ ከክብደቱ ክፍል በላይ የሚቆጠር 82 ሚሊዮን ፓራሜትሮችን የሚይዝ የጽሑፍ-ወደ-ንግግር ሞዴል ነው. በትንሹ መጠንም ቢሆን፣ አስደናቂ የሆነ ተፈጥሯዊና ግልጽ ንግግርን ያወጣል. ኮኮሮ ብዙ ቋንቋዎችን ያጠቃልላል - አማርኛ፣ ጃፓንኛ፣ ቻይንኛ፣ ኮሪያኛ፣ በተለያዩ ግልጽ ድምጾች. በጣም ፈጣን ነው - ከጂፒዩ ላይ ከሚገኝ እውነተኛ ጊዜ ድምፅ 100x ፈጣን ነው.

ምርጥ ለ: ከፍተኛ ጥራት ያለው TTS በጥቂት ጊዜ ውስጥ, የዥረት ፕሮግራሞች

ነጻ

PiperPiper ነጻ

ፒፐር በራሳስፒ የተፈጠረ ቀላል የጽሑፍ-ወደ-ንግግር ማሽን ነው VITS እና ላርኒክስ አርክቴክቸሮችን የሚጠቀም. በሙሉ በሲፒዩ ላይ ይሠራል ፣ ለ Edge መሣሪያዎች ፣ ለቤት አውቶማቲክስ ፣ እና ለኦፍላይን TTS የሚያስፈልጉ ፕሮግራሞች ተስማሚ ያደርገዋል. በ 30+ ቋንቋዎች ውስጥ ከ 100 በላይ ድምጾች ፣ ፒፐር በራስቤሪ ፒ 4 ላይም ቢሆን በፍጥነት ጊዜ ውስጥ ተፈጥሯዊ የሆነ ንግግር ይሰጣል ፡፡

ምርጥ ለ: የቅርብ ጊዜ ቅድመ ዕይታዎች፣ አቅላይነት፣ እና የተካተቱ ፕሮግራሞች

ነጻ

VITSVITS ነጻ

VITS (የማሻሻያ ውጤት ለመጨረሻው-ወደ-መጨረሻው ጽሑፍ-ወደ-ንግግር ለመማር) ከቀድሞው ሁለት-ደረጃ ሞዴሎች የበለጠ ተፈጥሯዊ የሆነ ድምፅ የሚያመነጭ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው. በነፃነት ውስጥ ትልቅ ማሻሻያ የሚያገኝ በሆነ የቀድሞው-ወደ-መጨረሻው ቴክኖሎጂ የተሻሻለ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው.

ምርጥ ለ: የቀን መቁጠሪያ አሳይ

ነጻ

MeloTTSMeloTTS ነጻ

MeloTTS በ MyShell.ai የተሰራ የብዙ ቋንቋዎች TTS መዝገብ ቤት ነው እንግሊዝኛ (አሜሪካዊ፣ ብሪታኒያዊ፣ የህንድ፣ የአውስትራሊያ), ስፓኒሽ, ፈረንሳይኛ, ቻይንኛ, ጃፓንኛ, እና ኮሪያኛ. በጣም ፈጣን ነው, ጽሑፍን በቅርብ ጊዜ ፍጥነት በ CPU ብቻ ላይ ይሠራል. MeloTTS ለምርት ጥቅም የተሰራ ነው እና CPU እና GPU ግምትን ይደግፋል.

ምርጥ ለ: ምርት ፕሮግራሞች ፈጣን, ብዙ ቋንቋዎች TTS ያስፈልጋሉ

ነጻ

Kani TTS 2Kani TTS 2 ነጻ

Kani-TTS-2 by NineNineSix በነዳጅ AI LFM2 backbone ላይ የተገነባ የ 400M ፓራሜትር ሞዴል ነው NVIDIA NanoCodec. በ 3GB VRAM ብቻ ይሠራል እና በ A100 (RTF 0.2) ላይ በ ~ 2 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶች ውስጥ ~ 10 ሰከንዶ

ምርጥ ለ: የፍጥነት እንግሊዝኛ መፍጠር በትንሽ-VRAM ሃርድዌር ላይ, ፈጣን ቅድመ ዕይታዎች

ነጻ

OuteTTSOuteTTS ነጻ

OuteTTS ትልቅ ቋንቋ ሞዴሎች ጋር ጽሑፍ-ወደ-ንግግር ችሎታዎችን በመጀመሪያው አርክቴክቸር ሲጠብቅ ይጨምራል. ይህ llama.cpp (CPU / GPU), Hugging ፊት ትራንስፎርሜሽን, ExLlamaV2, VLLM, እና ይልቅ ብራውዘር በ Transformers.js በመጠቀም ውጤት ጨምሮ ብዙ backends ይደግፋል. ባህሪያት zero-shot የድምፅ ክሎኒንግ እንደ JSON የተጠበቀ ተናጋሪ ፕሮፊሎች በመጠቀም.

ምርጥ ለ: የ Edge ማሰራጨት, የድር አሳሽ ላይ የተመሠረተ TTS, ዝቅተኛ-መዳረሻ አካባቢዎች

ነጻ

Pocket TTSPocket TTS ነጻ

Pocket TTS በኩዩታይ (የሞሺ ፈጣሪዎች) የተሰራው ከክብደቱ በላይ የሚቆረጥ የ100 ሜጋባት የጽሑፍ-ወደ-ንግግር ሞዴል ነው። በሲፒዩ ላይ በጥሩ ሁኔታ ይሠራል፣ ከአንድ ድምፅ ምሳሌ ጀምሮ የድምፅ ክሎኒንግን ይደግፋል፣ እናም ተፈጥሯዊ የሆነ ንግግርን ያወጣል። የቀን መቁጠሪያው ትንሽ መጠን ለ Edge ማሰራጨት እና ለጥቂት የኃይል ምንጮች አካባቢዎች ተስማሚ ያደርገዋል ፡፡

ምርጥ ለ: ቀላል ማሰራጨት, CPU- ብቻ አካባቢዎች, ፈጣን የድምፅ ክሎኒንግ

ነጻ

Kitten TTSKitten TTS ነጻ

Kitten TTS by KittenML on ONNX built an ultra-lightweight text-to-speech model. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ምርጥ ለ: ፈጣን ቀላል TTS, ዳርቻ መዘርጋት, ዝቅተኛ-Latency ፕሮግራሞች

ነጻ

Ming-Omni TTSMing-Omni TTS ነጻ

ሜንግ-Omni-tts-0.5B በ inclusionAI አንድ ከባድ Omni-modal ንግግር ሞዴል ነው በ BailingMM ጠንካራ backbone ላይ የተገነባ አንድ Patch-በ-Patch ፍሰት-ማጣጣም ድምፅ decoder ጋር. 44.1kHz ምርት (CD ጥራት ቅርብ) ይሰጣል, ከ 3 + ሴኮንድ ማመልከት zero-shot የድምፅ ክሎኒንግ ይደግፋል, እና በ JSON መመሪያዎች በኩል የተገነባው ስሜት / ተናጋሪ / BGM ቁጥጥር ያካትታል. ምርጥ መረጋጋት - 0.83% WER በቻይናኛ ባንኮች ላይ.

ምርጥ ለ: የሁለት ቋንቋዎች መናገር፣ ስሜት የሚቆጣጠረው የድምፅ አጫዋች፣ የቻይና የድምፅ መጽሐፍ ይዘት

ነጻ

MOSS-TTS NanoMOSS-TTS Nano ነጻ

MOSS-TTS-Nano-100M የ MOSS-TTS ቤተሰብ የ OpenMOSS 100M-parameter ልዩነት ነው, የጊዜ-ትራንስፎርመር አርክቴክቸር የሚጋራ. የ 8B ሞዴል የከፍተኛ ጥራት ለ ~ 80x ትንሽ ክብደት እና በጥብቅ በየጠየቁት VRAM ዝቅተኛ ነው, ለነፃ-ደረጃ እና ከፍተኛ-throughput መተላለፊያዎች ተስማሚ ያደርገዋል. ተመሳሳይ 20-language reach.

ምርጥ ለ: ነጻ-ደረጃ TTS, ከፍተኛ-ብዛት ምርት, ዝቅተኛ-Latency ተለዋዋጭ ጥቅም

ነጻ

BarkBark መደበኛ

የትራንስፎርመር የተመሠረተ ጽሑፍ-ወደ-ኦዲዮ ሞዴል እውነተኛ ንግግር፣ ሙዚቃ፣ እና የድምፅ ውጤቶችን የሚያመነጭ ነው።

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

Bark SmallBark Small መደበኛ

የባርክ ቀላል ስሪት በፍጥነት ማረጋገጫ እና ዝቅተኛ የማስታወሻ ጥቅም

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

CosyVoice 2CosyVoice 2 መደበኛ

የአሊባባ የሰው-አማካይ ተፈጥሮአዊነት እና የዝቅተኛ-ዝቅተኛነት የጨዋታ TTS

አዘጋጅ፦ Alibaba (Tongyi Lab) · ፈቃድ፦ Apache 2.0

ይሞክሩት

Dia TTSDia TTS መደበኛ

በብዙ ተናጋሪዎች መካከል ተፈጥሯዊ ውይይቶችን የሚፈጥር የዳታ ግራፊክ ሞዴል

አዘጋጅ፦ Nari Labs · ፈቃድ፦ Apache 2.0

ይሞክሩት

Parler TTSParler TTS መደበኛ

የሚፈልጉትን ድምፅ በነፃ ቋንቋ ግለጹና ፓርለር የሚስማማውን ንግግር ያወጣል

አዘጋጅ፦ Hugging Face · ፈቃድ፦ Apache 2.0

ይሞክሩት

IndexTTS-2IndexTTS-2 መደበኛ

0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.

አዘጋጅ፦ Index Team · ፈቃድ፦ Bilibili Model License

ይሞክሩት

Spark TTSSpark TTS መደበኛ

የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.

አዘጋጅ፦ SparkAudio · ፈቃድ፦ CC BY-NC-SA 4.0

ይሞክሩት

GPT-SoVITSGPT-SoVITS መደበኛ

የድምፅ ምትክ TTS ከ5 ሰከንዶች ብቻ የድምፅ ድምፅን የሚቀይር

አዘጋጅ፦ RVC-Boss · ፈቃድ፦ MIT

ይሞክሩት

OrpheusOrpheus መደበኛ

የሰው ደረጃ የስነ-ልቦና TTS ሞዴል በ 100K ሰዓታት የንግግር መረጃዎች ላይ የተጠናቀቀ ነው።

አዘጋጅ፦ Canopy Labs · ፈቃድ፦ Llama 3.2 Community

ይሞክሩት

Qwen3 TTSQwen3 TTS መደበኛ

የአሊባባ የብዙ ቋንቋ TTS ከጽሑፍ ጋር የተቀመጡ ድምጾች እና የድምፅ ዲዛይን

አዘጋጅ፦ Alibaba (Qwen) · ፈቃድ፦ Apache 2.0

ይሞክሩት

VieNeu-TTS-v2VieNeu-TTS-v2 መደበኛ

ቪዬትናምኛ + እንግሊዝኛ ኮድ-ማስተካከል TTS ጋር 7 ቀድሞ የተሰረዙ ድምጾች እና zero-shot የድምፅ ክሎኒንግ. CPU- ብቻ, ምንም GPU ያስፈልጋል.

አዘጋጅ፦ Phạm Nguyễn Ngọc Bảo · ፈቃድ፦ Apache 2.0

ይሞክሩት

Chatterbox TurboChatterbox Turbo መደበኛ

የፍጥነት ቻተርቦክስ ከ200 ሚሊሴኮንዶች ኋላቀርነት እና ለቁጭት፣ ለጉንፋን እና ለሌሎችም የቋንቋ ምልክቶች ጋር

አዘጋጅ፦ Resemble AI · ፈቃድ፦ MIT

ይሞክሩት

VoxCPMVoxCPM መደበኛ

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

አዘጋጅ፦ OpenBMB · ፈቃድ፦ Apache 2.0

ይሞክሩት

VibeVoiceVibeVoice መደበኛ

ማይክሮሶፍት ሞዴል ለረጅም ቅርጽ ብዙ-ተናጋሪ ይዘት እንደ ፖድካስቶች እና የድምፅ መጽሐፍት.

አዘጋጅ፦ Microsoft · ፈቃድ፦ MIT

ይሞክሩት

CosyVoice3CosyVoice3 መደበኛ

የወደፊቱ ትውልድ የብዙ ቋንቋ TTS በሁለት-streaming, ስሜት ቁጥጥር, እና zero-shot የድምፅ ክሎኒንግ ጋር.

አዘጋጅ፦ Alibaba (FunAudioLLM) · ፈቃድ፦ Apache 2.0

ይሞክሩት

NAMAA Saudi TTSNAMAA Saudi TTS መደበኛ

የመጀመሪያው የቀረበው የሳዑዲ-ዐረብኛ TTS. የሳዑዲ ቋንቋ በቻተርቦክስ-ጥራት የድምፅ ክሎኒንግ ጋር

አዘጋጅ፦ NAMAA Space · ፈቃድ፦ MIT

ይሞክሩት

Darwin TTSDarwin TTS መደበኛ

የQwen3-1.7B ቋንቋ ሞዴል ከ FFN ክብደት ጋር የተቀላቀለ የQwen3-TTS ልዩነት ለብዙ ቋንቋዎች ክሎኒንግ

አዘጋጅ፦ FINAL-Bench · ፈቃድ፦ Apache 2.0

ይሞክሩት

MOSS-TTSDMOSS-TTSD መደበኛ

የብዙ-ተናጋሪ ውይይት የቀጠለ ሞዴል - እስከ 5 ተናጋሪዎች እና 60 ደቂቃዎች የሚጠበቅ የድምፅ ድምፅ ያላቸው የፖድካስት-ስርዓት ውይይቶችን ይፈጥሩ.

አዘጋጅ፦ OpenMOSS · ፈቃድ፦ Apache 2.0

ይሞክሩት

ChatterboxChatterbox ተቀማጭ

የቅርብ ጊዜውን የድምፅ ክሎኒንግ ከ Resemble AI ጋር

ጥራት፦

ይሞክሩት

Tortoise TTSTortoise TTS ተቀማጭ

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ በራስ-መለወጥ አርክቴክቸር.

ጥራት፦

ይሞክሩት

StyleTTS 2StyleTTS 2 ተቀማጭ

የሰው ደረጃ ጽሑፍ-ወደ-ንግግር በሥነ-ጥበብ መሰራጨት እና ተቃራኒ ስልጠናዎች

ጥራት፦

ይሞክሩት

OpenVoiceOpenVoice ተቀማጭ

የድምፅ ክሎኒንግ በቅርጽ፣ በፍላጎትና በድምፅ ላይ በጥልቀት መቆጣጠር

ጥራት፦

ይሞክሩት

Sesame CSMSesame CSM ተቀማጭ

የንግግር ሞዴል በበቂ ጊዜና ስሜት የተፈጥሮ ውይይት የሚያመነጭ

ጥራት፦

ይሞክሩት

CosyVoice 2CosyVoice 2

የአሊባባ የሰው-አማካይ ተፈጥሮአዊነት እና የዝቅተኛ-ዝቅተኛነት የጨዋታ TTS

ቋንቋዎች፦ en, zh, ja, ko, fr, de, it, es

የድምፅ ፋይል

IndexTTS-2IndexTTS-2

0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

Spark TTSSpark TTS

የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

GPT-SoVITSGPT-SoVITS

የድምፅ ምትክ TTS ከ5 ሰከንዶች ብቻ የድምፅ ድምፅን የሚቀይር

ቋንቋዎች፦ en, zh, ja, ko

የድምፅ ፋይል

ChatterboxChatterbox

የቅርብ ጊዜውን የድምፅ ክሎኒንግ ከ Resemble AI ጋር

ቋንቋዎች፦ en

የድምፅ ፋይል

Tortoise TTSTortoise TTS

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ በራስ-መለወጥ አርክቴክቸር.

ቋንቋዎች፦ en

የድምፅ ፋይል

OpenVoiceOpenVoice

የድምፅ ክሎኒንግ በቅርጽ፣ በፍላጎትና በድምፅ ላይ በጥልቀት መቆጣጠር

ቋንቋዎች፦ en, zh, ja, ko, fr, es

የድምፅ ፋይል

VieNeu-TTS-v2VieNeu-TTS-v2

ቪዬትናምኛ + እንግሊዝኛ ኮድ-ማስተካከል TTS ጋር 7 ቀድሞ የተሰረዙ ድምጾች እና zero-shot የድምፅ ክሎኒንግ. CPU- ብቻ, ምንም GPU ያስፈልጋል.

ቋንቋዎች፦ vi, en

የድምፅ ፋይል

Chatterbox TurboChatterbox Turbo

የፍጥነት ቻተርቦክስ ከ200 ሚሊሴኮንዶች ኋላቀርነት እና ለቁጭት፣ ለጉንፋን እና ለሌሎችም የቋንቋ ምልክቶች ጋር

ቋንቋዎች፦ en

የድምፅ ፋይል

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

OuteTTSOuteTTS

LLM-based TTS በ CPU, GPU, ወይም በ lama.cpp እና Transformers.js በኩል በብራውዘር ላይ የሚሰራ

ቋንቋዎች፦ en

የድምፅ ፋይል

Pocket TTSPocket TTS

የኪዩታይ ቀላል 100M ፐራሜትር ሞዴል ከአንድ ምሳሌ የድምፅ ክሎኒንግ ጋር

ቋንቋዎች፦ en, fr

የድምፅ ፋይል

CosyVoice3CosyVoice3

የወደፊቱ ትውልድ የብዙ ቋንቋ TTS በሁለት-streaming, ስሜት ቁጥጥር, እና zero-shot የድምፅ ክሎኒንግ ጋር.

ቋንቋዎች፦ en, zh, ja, ko, de, es, fr, it, ru

የድምፅ ፋይል

NAMAA Saudi TTSNAMAA Saudi TTS

የመጀመሪያው የቀረበው የሳዑዲ-ዐረብኛ TTS. የሳዑዲ ቋንቋ በቻተርቦክስ-ጥራት የድምፅ ክሎኒንግ ጋር

ቋንቋዎች፦ ar

የድምፅ ፋይል

Darwin TTSDarwin TTS

የQwen3-1.7B ቋንቋ ሞዴል ከ FFN ክብደት ጋር የተቀላቀለ የQwen3-TTS ልዩነት ለብዙ ቋንቋዎች ክሎኒንግ

ቋንቋዎች፦ en, ko, ja, zh

የድምፅ ፋይል

MOSS-TTSDMOSS-TTSD

የብዙ-ተናጋሪ ውይይት የቀጠለ ሞዴል - እስከ 5 ተናጋሪዎች እና 60 ደቂቃዎች የሚጠበቅ የድምፅ ድምፅ ያላቸው የፖድካስት-ስርዓት ውይይቶችን ይፈጥሩ.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

Ming-Omni TTSMing-Omni TTS

ከinclusionAI ጋር የ 0.5B ኦምኒ-ሞዳል ንግግር ሞዴል ከከፍተኛ ፍቅር 44.1kHz ምርት እና zero-shot የድምፅ ክሎኒንግ ጋር.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

MOSS-TTS NanoMOSS-TTS Nano

ትናንሽ 100M MOSS-TTS ልዩነት - ተመሳሳይ አርክቴክቸር, 80x ትንሽ, ነፃ-ደረጃ latency.

ቋንቋዎች፦ en, zh, de, es, fr, ja, it, ko, ru, ar, pt

የድምፅ ፋይል

የዳቬሎፐር-መጀመሪያ API

OpenAI-ተኳሃኝ REST API. አንድ መጨረሻ ነጥብ, 22+ ሞዴሎች. ለ እውነተኛ ጊዜ ፕሮግራሞች ስትሪሚንግ ድጋፍ.

  • ፋይል (_F)
  • ለወቅታዊ ፕሮግራሞች TTS ማስተላለፍ
  • ለታላላቅ ስራዎች የቡት ሂደት
  • የዌብሆክ ማስታወቂያዎች
የAPI ሰነዶች
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ቀላል, ግልጽ ዋጋ

ነጻ ይጀምሩ. እንደምትጨምሩ መጠን ይጨምሩ.

ነጻ

$0

15,000 አርእስቶች + 5,000/ቀን

  • 7 ነጻ ሞዴሎች ኮኮሮን ጨምሮ
  • ፊደላት
  • API መዳረሻ ተካትቷል
ነጻ

መተላለፊያ

$9/ወራት

ወር

  • ሁሉም 22+ ሞዴሎች
  • ፊደላት
  • የድምፅ ክሎኒንግ
መጀመር
በጣም ተወዳጅ

$29/ወራት

ወር

  • ሁሉንም በጀምር
  • API መዳረሻ
  • አቀማመጥ
ፋይል (_F)

የሥራ

$99/ወራት

ወር

  • ሁሉንም በፕሮ
  • ብዛት፦
  • የፋይል ስም፦ (_F)
የስራ ቦታ

ሁሉንም ዕቅዶች አሳይ →

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

TTS.ai በጣም አጠቃላይ AI የድምፅ መድረክ ነው, 22 + ጽሑፍ-ወደ-ንግግር ሞዴሎችን, የድምፅ ክሎኒንግ, ንግግር-ወደ-ጽሑፍ, እና የድምፅ መሣሪያዎች. ሁሉም ሞዴሎች ነፃ ምንጭ ናቸው ምንም ሻጭ lock-in.

አዎ! TTS.ai በኮኮሮ፣ በፒፐር፣ በቪቲኤስ እና በሜሎቲቲኤስ ሞዴሎች ነፃ የጽሑፍ-ወደ-ንግግር አገልግሎቶችን ይሰጣል። ምንም ዓይነት ምዝገባ አይጠየቅም። 15,000 ነፃ ፊደላትን ለመቀበል እና ሁሉንም ሞዴሎች ለመድረስ ይመዝገቡ። የተከፈለባቸው ፕሮግራሞች በ $9 / ወር ይጀምራሉ ፡፡

ለፍጥነት ኮኮሮ ወይም ፒፐር ይጠቀሙ። ለጥራት ኮሲቮይሴ 2 ወይም ስቴይልቲቲኤስ 2 ይሞክሩ። ለድምፅ ክሎኒንግ ቻተርቦክስ ወይም ጂፒቲ-ሶቪትስ ይጠቀሙ። ለዳያሎግ ዲያ ቲቲኤስ ይጠቀሙ። ለመወዳደር በተመሳሳይ ጽሑፍ ላይ ብዙ ሞዴሎችን ይሞክሩ።

አዎ. OpenAI-ተኳሃኝ REST API ለ TTS, STT, የድምፅ ክሎኒንግ, እና የድምፅ መሣሪያዎች. ነፃ ጨምሮ በሁሉም ዕቅድ ላይ የተካተተ, በደረጃው የሚለካው የፍጥነት ገደቦች (ነፃ: 10 req / ደቂቃ, Lite: 20, Starter: 30, Pro: 60, Business: 300). tts.ai / api / ላይ ሰነዶችን ይመልከቱ.

የድምፅ ጥራት በሞዴል ይለያያል። እንደ ኮሲቮይስ 2፣ ስታይልቲቲኤስ 2፣ እና ቻተርቦክስ ያሉ የፕሪሚየም ሞዴሎች ከሰው ጋር ተመሳሳይ የድምፅ ጥራት ያላቸውን ቃላት በባህላዊ ድምፅና ስሜት ያቀርባሉ። እንደ ኮኮሮ ያሉ ነፃ ሞዴሎች ለብዙዎቹ የመጠቀም ጉዳዮች ምርጥ ጥራት ያቀርባሉ።

TTS.ai በሞዴል መዝገብ ቤቱ ውስጥ 30+ ቋንቋዎችን ይደግፋል. እንግሊዝኛ በጣም ሰፊ የሆነ የሞዴል ድጋፍ አለው፣ ግን እንደ ኮሲቮይስ 2 ያሉ ሞዴሎች ቻይንኛ፣ ጃፓንኛ እና ኮሪያን ይሸፍናሉ፤ GPT-SoVITS ቻይንኛ፣ ጃፓንኛ፣ ኮሪያን እና እንግሊዝኛን ይሸፍናሉ፤ እና MeloTTS ቻይንኛ፣ ስፓኒሽ፣ ፈረንሳይኛ፣ ቻይንኛ፣ ጃፓንኛ እና ኮሪያን ይደግፋሉ።

አዎ. ሁሉም ሂደት በግላዊ GPU ሰርቨሮች ላይ ይከናወናል. የጽሑፍዎ ምዝገባ ወይም ከተሰጠ በኋላ የተፈጠረ ድምፅ አናስቀምጥም. ለክሎኒንግ የተጫኑ የድምፅ ምሳሌዎች ለወደፊቱ ክፍለ ጊዜ ብቻ ይጠቀማሉ እናም አይቆዩም. እኛ መረጃዎን በሶስተኛ ወገን ጋር አናጋራም ወይም ሞዴሎችን ለማስተማር እንጠቀማለን

አዎ. በ TTS.ai ላይ የተፈጠረው ድምፅ ሁሉ ለዩቲዩብ ቪዲዮዎች፣ ለፖድካስቶች፣ ለአውዲዮ መጽሐፍት፣ ለአፕሊኬሽኖች፣ ለገጾች እና ለምርቶች ጨምሮ ለኮሜርሺያል ጥቅም የሚውል ነው. ሞዴሎቻችን በፈቃድ ፈቃዶች (MIT, Apache 2.0) ስር የቀረቡ ናቸው። ምንም የባለቤትነት መብት ወይም ተቀባይነት የለም ፡፡

TTS.ai ለከፍተኛ ጥራት ድምፅን በWAV ቅርጸት ያወጣል. ነፃ የድምፅ መለወጫችንን በመጠቀም ወደ MP3፣ FLAC፣ OGG ወይም M4A መለወጥ ይችላሉ። API የተሻለውን የድምፅ ቅርጸት በቀጥታ በጠየቁት ውስጥ ማሳየት ይደግፋል

የድምፅ ቅደም ተከተል (ከ5 ሰከንዶች በታች) ለመክተት የምትፈልገውን የድምፅ ቅደም ተከተል ይጫኑ፣ ከዚያም በድምፅ ውስጥ ንግግርን ለመፍጠር ማንኛውንም ጽሑፍ ይጻፉ። እንደ ቻተርቦክስ፣ ጂፒቲ-ሶቪትስ፣ እና ኮሲቮይስ 2 ያሉ ሞዴሎች የድምፅ ቅደም ተከተልን ይደግፋሉ። የተከታተለው ድምፅ ድምፅን፣ ድምፅን እና የመናገር ዘይቤን ይይዛል።

ነጻ ሞዴሎች (ኮኮሮ, Piper, VITS, MeloTTS) ምንም መለያ አይጠይቁም እና የዝቅተኛ ፊደላት ዋጋ አላቸው. ስታንዳርድ ሞዴሎች (2,000 ፊደላት / 1K ምዝገባ) Bark, CosyVoice 2, F5-TTS, እና Dia ይዘው ይመጣሉ. ፕሪሚየም ሞዴሎች (4,000 ፊደላት / 1K ምዝገባ) OpenVoice, Chatterbox, StyleTTS 2, እና Tortoise ይዘው ይመጣሉ. የተከፈለ ሞዴሎች በዋናነት ከፍተኛ ጥራት ያላቸውን ፣ የበለጠ ድምጾችን እና እንደ ድምፅ ክሎኒንግ ያሉ ሌሎች ባህሪያትን ያቀርባሉ ፡፡

አዎ. የAPI ረጅም የጽሑፍ መጠን ወደ ንግግር ለመለወጥ የባች ሂደት ይደግፋል. ብዙ ጥያቄዎችን ያቀርቡ እና የስራ UUIDsን በመጠቀም ውጤቶችን በተመሳሳይ ጊዜ ያገኙ. የቢዝነስ ዕቅድ ($99 / ወር) እና ከዚያ በላይ ለፍጥነት የባች ሂደት የቅድሚያ መስመር መዳረሻን ያካትታሉ. ለኦዲዮ መጽሐፍ ምርት፣ የኮርስ ይዘት እና ለታላላቅ የድምፅ ፕሮጀክቶች ተስማሚ ነው.
4.1/5 (42)

ምን ማሻሻል እንችላለን? አስተያየቶችዎ ችግሮችን ለመፍታት ይረዳሉ.

ዛሬ AI ድምፅን ይጠቀሙ

TTS.aiን በመጠቀም ፈጣሪዎችን፣ ዳይቨሎፐሮችን እና ንግዶችን ይቀላቀሉ