ነጻ AI ጽሑፉን ወደ ንግግር ለውጥ

31+ ክፍት ምንጭ ሞዴሎች, 231+ ድምጾች 34+ ቋንቋዎች. የግልጽነት ያስፈልጋል

8K+
ፈጣሪዎች
32K+
ትውልዶች
31+
AI ሞዴሎች
231+
ድምጾች
0/500 ፊደላት · Sign up for 5,000 per generation → ነጻ
ፊደላት ፊደላት የክሬዲት ካርድ የለም የኮሜርስ ጥቅም
ነጻ
ድምፅ ያውርዱ መገናኛ በ24 ሰዓት ውስጥ ይቋረጣል
TTS.aiን ወዳጅነት?

ለድምፅ AI የሚያስፈልግዎ ሁሉ

30+ መሣሪያዎች በነጻ ምንጭ AI ሞዴሎች የተገነቡ

31+ የድምፅ ሞዴሎች

በአንድ መድረክ ውስጥ የ TTS ሞዴሎችን በጣም የተሟላ ስብስብ

KokoroKokoro ነጻ

ኮኮሮ ከክብደቱ ክፍል በላይ የሚቆጠር 82 ሚሊዮን ፓራሜትሮችን የሚይዝ የጽሑፍ-ወደ-ንግግር ሞዴል ነው. በትንሹ መጠንም ቢሆን፣ አስደናቂ የሆነ ተፈጥሯዊና ግልጽ ንግግርን ያወጣል. ኮኮሮ ብዙ ቋንቋዎችን ያጠቃልላል - አማርኛ፣ ጃፓንኛ፣ ቻይንኛ፣ ኮሪያኛ፣ በተለያዩ ግልጽ ድምጾች. በጣም ፈጣን ነው - ከጂፒዩ ላይ ከሚገኝ እውነተኛ ጊዜ ድምፅ 100x ፈጣን ነው.

ምርጥ ለ: ከፍተኛ ጥራት ያለው TTS በጥቂት ጊዜ ውስጥ, የዥረት ፕሮግራሞች

ነጻ

PiperPiper ነጻ

ፒፐር በራሳስፒ የተፈጠረ ቀላል የጽሑፍ-ወደ-ንግግር ማሽን ነው VITS እና ላርኒክስ አርክቴክቸሮችን የሚጠቀም. በሙሉ በሲፒዩ ላይ ይሠራል ፣ ለ Edge መሣሪያዎች ፣ ለቤት አውቶማቲክስ ፣ እና ለኦፍላይን TTS የሚያስፈልጉ ፕሮግራሞች ተስማሚ ያደርገዋል. በ 30+ ቋንቋዎች ውስጥ ከ 100 በላይ ድምጾች ፣ ፒፐር በራስቤሪ ፒ 4 ላይም ቢሆን በፍጥነት ጊዜ ውስጥ ተፈጥሯዊ የሆነ ንግግር ይሰጣል ፡፡

ምርጥ ለ: የቅርብ ጊዜ ቅድመ ዕይታዎች፣ አቅላይነት፣ እና የተካተቱ ፕሮግራሞች

ነጻ

VITSVITS ነጻ

VITS (የማሻሻያ ውጤት ለመጨረሻው-ወደ-መጨረሻው ጽሑፍ-ወደ-ንግግር ለመማር) ከቀድሞው ሁለት-ደረጃ ሞዴሎች የበለጠ ተፈጥሯዊ የሆነ ድምፅ የሚያመነጭ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው. በነፃነት ውስጥ ትልቅ ማሻሻያ የሚያገኝ በሆነ የቀድሞው-ወደ-መጨረሻው ቴክኖሎጂ የተሻሻለ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው.

ምርጥ ለ: የቀን መቁጠሪያ አሳይ

ነጻ

MeloTTSMeloTTS ነጻ

MeloTTS በ MyShell.ai የተሰራ የብዙ ቋንቋዎች TTS መዝገብ ቤት ነው እንግሊዝኛ (አሜሪካዊ፣ ብሪታኒያዊ፣ የህንድ፣ የአውስትራሊያ), ስፓኒሽ, ፈረንሳይኛ, ቻይንኛ, ጃፓንኛ, እና ኮሪያኛ. በጣም ፈጣን ነው, ጽሑፍን በቅርብ ጊዜ ፍጥነት በ CPU ብቻ ላይ ይሠራል. MeloTTS ለምርት ጥቅም የተሰራ ነው እና CPU እና GPU ግምትን ይደግፋል.

ምርጥ ለ: ምርት ፕሮግራሞች ፈጣን, ብዙ ቋንቋዎች TTS ያስፈልጋሉ

ነጻ

OuteTTSOuteTTS ነጻ

OuteTTS ትልቅ ቋንቋ ሞዴሎች ጋር ጽሑፍ-ወደ-ንግግር ችሎታዎችን በመጀመሪያው አርክቴክቸር ሲጠብቅ ይጨምራል. ይህ llama.cpp (CPU / GPU), Hugging ፊት ትራንስፎርሜሽን, ExLlamaV2, VLLM, እና ይልቅ ብራውዘር በ Transformers.js በመጠቀም ውጤት ጨምሮ ብዙ backends ይደግፋል. ባህሪያት zero-shot የድምፅ ክሎኒንግ እንደ JSON የተጠበቀ ተናጋሪ ፕሮፊሎች በመጠቀም.

ምርጥ ለ: የ Edge ማሰራጨት, የድር አሳሽ ላይ የተመሠረተ TTS, ዝቅተኛ-መዳረሻ አካባቢዎች

ነጻ

Pocket TTSPocket TTS ነጻ

Pocket TTS በኩዩታይ (የሞሺ ፈጣሪዎች) የተሰራው ከክብደቱ በላይ የሚቆረጥ የ100 ሜጋባት የጽሑፍ-ወደ-ንግግር ሞዴል ነው። በሲፒዩ ላይ በጥሩ ሁኔታ ይሠራል፣ ከአንድ ድምፅ ምሳሌ ጀምሮ የድምፅ ክሎኒንግን ይደግፋል፣ እናም ተፈጥሯዊ የሆነ ንግግርን ያወጣል። የቀን መቁጠሪያው ትንሽ መጠን ለ Edge ማሰራጨት እና ለጥቂት የኃይል ምንጮች አካባቢዎች ተስማሚ ያደርገዋል ፡፡

ምርጥ ለ: ቀላል ማሰራጨት, CPU- ብቻ አካባቢዎች, ፈጣን የድምፅ ክሎኒንግ

ነጻ

Kitten TTSKitten TTS ነጻ

Kitten TTS by KittenML on ONNX built an ultra-lightweight text-to-speech model. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ምርጥ ለ: ፈጣን ቀላል TTS, ዳርቻ መዘርጋት, ዝቅተኛ-Latency ፕሮግራሞች

ነጻ

BarkBark መደበኛ

የትራንስፎርመር የተመሠረተ ጽሑፍ-ወደ-ኦዲዮ ሞዴል እውነተኛ ንግግር፣ ሙዚቃ፣ እና የድምፅ ውጤቶችን የሚያመነጭ ነው።

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

Bark SmallBark Small መደበኛ

የባርክ ቀላል ስሪት በፍጥነት ማረጋገጫ እና ዝቅተኛ የማስታወሻ ጥቅም

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

CosyVoice 2CosyVoice 2 መደበኛ

የአሊባባ የሰው-አማካይ ተፈጥሮአዊነት እና የዝቅተኛ-ዝቅተኛነት የጨዋታ TTS

አዘጋጅ፦ Alibaba (Tongyi Lab) · ፈቃድ፦ Apache 2.0

ይሞክሩት

Dia TTSDia TTS መደበኛ

በብዙ ተናጋሪዎች መካከል ተፈጥሯዊ ውይይቶችን የሚፈጥር የዳታ ግራፊክ ሞዴል

አዘጋጅ፦ Nari Labs · ፈቃድ፦ Apache 2.0

ይሞክሩት

Parler TTSParler TTS መደበኛ

የሚፈልጉትን ድምፅ በነፃ ቋንቋ ግለጹና ፓርለር የሚስማማውን ንግግር ያወጣል

አዘጋጅ፦ Hugging Face · ፈቃድ፦ Apache 2.0

ይሞክሩት

GLM-TTSGLM-TTS መደበኛ

የ TTS ሞዴሎችን በነጻ ምንጭ መካከል ዝቅተኛውን የፊደል ስህተት መጠን ያገኛል

አዘጋጅ፦ Zhipu AI · ፈቃድ፦ GLM-4 License

ይሞክሩት

IndexTTS-2IndexTTS-2 መደበኛ

0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.

አዘጋጅ፦ Index Team · ፈቃድ፦ Bilibili Model License

ይሞክሩት

Spark TTSSpark TTS መደበኛ

የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.

አዘጋጅ፦ SparkAudio · ፈቃድ፦ CC BY-NC-SA 4.0

ይሞክሩት

GPT-SoVITSGPT-SoVITS መደበኛ

የድምፅ ምትክ TTS ከ5 ሰከንዶች ብቻ የድምፅ ድምፅን የሚቀይር

አዘጋጅ፦ RVC-Boss · ፈቃድ፦ MIT

ይሞክሩት

OrpheusOrpheus መደበኛ

የሰው ደረጃ የስነ-ልቦና TTS ሞዴል በ 100K ሰዓታት የንግግር መረጃዎች ላይ የተጠናቀቀ ነው።

አዘጋጅ፦ Canopy Labs · ፈቃድ፦ Llama 3.2 Community

ይሞክሩት

Qwen3 TTSQwen3 TTS መደበኛ

የአሊባባ የብዙ ቋንቋዎች TTS የድምፅ ክሎኒንግ, ቀድሞ የተቀመጡ ድምጾች, እና የድምፅ ዲዛይን ከጽሑፍ ጋር.

አዘጋጅ፦ Alibaba (Qwen) · ፈቃድ፦ Apache 2.0

ይሞክሩት

Chatterbox TurboChatterbox Turbo መደበኛ

የፍጥነት ቻተርቦክስ ከ200 ሚሊሴኮንዶች ኋላቀርነት እና ለቁጭት፣ ለጉንፋን እና ለሌሎችም የቋንቋ ምልክቶች ጋር

አዘጋጅ፦ Resemble AI · ፈቃድ፦ MIT

ይሞክሩት

Dia 2Dia 2 መደበኛ

የቀጥታ-መጀመሪያ ቃለ-መጠይቅ TTS ጋር ብዙ-ተናጋሪ ውይይት እና paralinguistic ጫፎች.

አዘጋጅ፦ Nari Labs · ፈቃድ፦ Apache 2.0

ይሞክሩት

VoxCPMVoxCPM መደበኛ

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

አዘጋጅ፦ OpenBMB · ፈቃድ፦ Apache 2.0

ይሞክሩት

TADATADA መደበኛ

0-Hallucination TTS ፅሁፍ-አኩስቲክ ሁለት አቅጣጫ, 5x ከፍ ያለ ተመሳሳይ LLM TTS.

አዘጋጅ፦ Hume AI · ፈቃድ፦ MIT

ይሞክሩት

VibeVoiceVibeVoice መደበኛ

ማይክሮሶፍት ሞዴል ለረጅም ቅርጽ ብዙ-ተናጋሪ ይዘት እንደ ፖድካስቶች እና የድምፅ መጽሐፍት.

አዘጋጅ፦ Microsoft · ፈቃድ፦ MIT

ይሞክሩት

CosyVoice3CosyVoice3 መደበኛ

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

አዘጋጅ፦ Alibaba (FunAudioLLM) · ፈቃድ፦ Apache 2.0

ይሞክሩት

ChatterboxChatterbox ተቀማጭ

የቅርብ ጊዜውን የድምፅ ክሎኒንግ ከ Resemble AI ጋር

ጥራት፦

ይሞክሩት

Tortoise TTSTortoise TTS ተቀማጭ

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ በራስ-መለወጥ አርክቴክቸር.

ጥራት፦

ይሞክሩት

StyleTTS 2StyleTTS 2 ተቀማጭ

የሰው ደረጃ ጽሑፍ-ወደ-ንግግር በሥነ-ጥበብ መሰራጨት እና ተቃራኒ ስልጠናዎች

ጥራት፦

ይሞክሩት

OpenVoiceOpenVoice ተቀማጭ

የድምፅ ክሎኒንግ በቅርጽ፣ በፍላጎትና በድምፅ ላይ በጥልቀት መቆጣጠር

ጥራት፦

ይሞክሩት

Sesame CSMSesame CSM ተቀማጭ

የንግግር ሞዴል በበቂ ጊዜና ስሜት የተፈጥሮ ውይይት የሚያመነጭ

ጥራት፦

ይሞክሩት

MOSS-TTSMOSS-TTS ተቀማጭ

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ጥራት፦

ይሞክሩት

MegaTTS3MegaTTS3 ተቀማጭ

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ጥራት፦

ይሞክሩት

CosyVoice 2CosyVoice 2

የአሊባባ የሰው-አማካይ ተፈጥሮአዊነት እና የዝቅተኛ-ዝቅተኛነት የጨዋታ TTS

ቋንቋዎች፦ en, zh, ja, ko, fr, de, it, es

የድምፅ ፋይል

GLM-TTSGLM-TTS

የ TTS ሞዴሎችን በነጻ ምንጭ መካከል ዝቅተኛውን የፊደል ስህተት መጠን ያገኛል

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

IndexTTS-2IndexTTS-2

0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

Spark TTSSpark TTS

የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

GPT-SoVITSGPT-SoVITS

የድምፅ ምትክ TTS ከ5 ሰከንዶች ብቻ የድምፅ ድምፅን የሚቀይር

ቋንቋዎች፦ en, zh, ja, ko

የድምፅ ፋይል

ChatterboxChatterbox

የቅርብ ጊዜውን የድምፅ ክሎኒንግ ከ Resemble AI ጋር

ቋንቋዎች፦ en

የድምፅ ፋይል

Tortoise TTSTortoise TTS

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ በራስ-መለወጥ አርክቴክቸር.

ቋንቋዎች፦ en

የድምፅ ፋይል

OpenVoiceOpenVoice

የድምፅ ክሎኒንግ በቅርጽ፣ በፍላጎትና በድምፅ ላይ በጥልቀት መቆጣጠር

ቋንቋዎች፦ en, zh, ja, ko, fr, de, es, it

የድምፅ ፋይል

Qwen3 TTSQwen3 TTS

የአሊባባ የብዙ ቋንቋዎች TTS የድምፅ ክሎኒንግ, ቀድሞ የተቀመጡ ድምጾች, እና የድምፅ ዲዛይን ከጽሑፍ ጋር.

ቋንቋዎች፦ en, zh, ja, ko, de, fr, ru, pt, es, it

የድምፅ ፋይል

Chatterbox TurboChatterbox Turbo

የፍጥነት ቻተርቦክስ ከ200 ሚሊሴኮንዶች ኋላቀርነት እና ለቁጭት፣ ለጉንፋን እና ለሌሎችም የቋንቋ ምልክቶች ጋር

ቋንቋዎች፦ en

የድምፅ ፋይል

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

OuteTTSOuteTTS

LLM-based TTS በ CPU, GPU, ወይም በ lama.cpp እና Transformers.js በኩል በብራውዘር ላይ የሚሰራ

ቋንቋዎች፦ en

የድምፅ ፋይል

Pocket TTSPocket TTS

የኪዩታይ ቀላል 100M ፐራሜትር ሞዴል ከአንድ ምሳሌ የድምፅ ክሎኒንግ ጋር

ቋንቋዎች፦ en, fr

የድምፅ ፋይል

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ቋንቋዎች፦ en, zh, ja, ko, de, es, fr, it, ru

የድምፅ ፋይል

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ቋንቋዎች፦ en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

የድምፅ ፋይል

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ቋንቋዎች፦ en, zh

የድምፅ ፋይል

የዳቬሎፐር-መጀመሪያ API

OpenAI-ተኳሃኝ REST API. አንድ መጨረሻ ነጥብ, 22+ ሞዴሎች. ለ እውነተኛ ጊዜ ፕሮግራሞች ስትሪሚንግ ድጋፍ.

  • ፋይል (_F)
  • ለወቅታዊ ፕሮግራሞች TTS ማስተላለፍ
  • ለታላላቅ ስራዎች የቡት ሂደት
  • የዌብሆክ ማስታወቂያዎች
የAPI ሰነዶች
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ቀላል, ግልጽ ዋጋ

ነጻ ይጀምሩ. እንደምትጨምሩ መጠን ይጨምሩ.

ነጻ

$0

15 ክሬዲቶች

  • Kokoro, Piper, VITS, MeloTTS
  • ፊደል(ሎች)
  • 3 ጂን/ሰዓት (የሂሳብ አይኖርም)
ነጻ

መተላለፊያ

$9/ወራት

ወር

  • ሁሉም 22+ ሞዴሎች
  • ፊደላት
  • የድምፅ ክሎኒንግ
መጀመር
በጣም ተወዳጅ

$29/ወራት

ወር

  • ሁሉንም በጀምር
  • API መዳረሻ
  • አቀማመጥ
ፋይል (_F)

የሥራ

$99/ወራት

ወር

  • ሁሉንም በፕሮ
  • ብዛት፦
  • የፋይል ስም፦ (_F)
የስራ ቦታ

ሁሉንም ዕቅዶች አሳይ →

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

TTS.ai በጣም አጠቃላይ AI የድምፅ መድረክ ነው, 22 + ጽሑፍ-ወደ-ንግግር ሞዴሎችን, የድምፅ ክሎኒንግ, ንግግር-ወደ-ጽሑፍ, እና የድምፅ መሣሪያዎች. ሁሉም ሞዴሎች ነፃ ምንጭ ናቸው ምንም ሻጭ lock-in.

አዎ! TTS.ai በኮኮሮ፣ በፒፐር፣ በቪቲኤስ እና በሜሎቲቲኤስ ሞዴሎች ነፃ የጽሑፍ-ወደ-ንግግር አገልግሎቶችን ይሰጣል። ምንም ዓይነት ምዝገባ አይጠየቅም። 15,000 ነፃ ፊደላትን ለመቀበል እና ሁሉንም ሞዴሎች ለመድረስ ይመዝገቡ። የተከፈለባቸው ፕሮግራሞች በ $9 / ወር ይጀምራሉ ፡፡

ለፍጥነት ኮኮሮ ወይም ፒፐር ይጠቀሙ። ለጥራት ኮሲቮይሴ 2 ወይም ስቴይልቲቲኤስ 2 ይሞክሩ። ለድምፅ ክሎኒንግ ቻተርቦክስ ወይም ጂፒቲ-ሶቪትስ ይጠቀሙ። ለዳያሎግ ዲያ ቲቲኤስ ይጠቀሙ። ለመወዳደር በተመሳሳይ ጽሑፍ ላይ ብዙ ሞዴሎችን ይሞክሩ።

አዎ. OpenAI-ተኳሃኝ REST API ለ TTS, STT, የድምፅ ክሎኒንግ, እና የድምፅ መሣሪያዎች. በፕሮ ($ 29 / ወር) እና ኢንተርፕራይዝ ($ 99 / ወር) ዕቅዶች ላይ ይገኛል. tts.ai / api / ላይ ሰነዶችን ይመልከቱ.

የድምፅ ጥራት በሞዴል ይለያያል። እንደ ኮሲቮይስ 2፣ ስታይልቲቲኤስ 2፣ እና ቻተርቦክስ ያሉ የፕሪሚየም ሞዴሎች ከሰው ጋር ተመሳሳይ የድምፅ ጥራት ያላቸውን ቃላት በባህላዊ ድምፅና ስሜት ያቀርባሉ። እንደ ኮኮሮ ያሉ ነፃ ሞዴሎች ለብዙዎቹ የመጠቀም ጉዳዮች ምርጥ ጥራት ያቀርባሉ።

TTS.ai በሞዴል መዝገብ ቤቱ ውስጥ 30+ ቋንቋዎችን ይደግፋል. እንግሊዝኛ በጣም ሰፊ የሆነ የሞዴል ድጋፍ አለው፣ ግን እንደ ኮሲቮይስ 2 ያሉ ሞዴሎች ቻይንኛ፣ ጃፓንኛ እና ኮሪያን ይሸፍናሉ፤ GPT-SoVITS ቻይንኛ፣ ጃፓንኛ፣ ኮሪያን እና እንግሊዝኛን ይሸፍናሉ፤ እና MeloTTS ቻይንኛ፣ ስፓኒሽ፣ ፈረንሳይኛ፣ ቻይንኛ፣ ጃፓንኛ እና ኮሪያን ይደግፋሉ።

አዎ. ሁሉም ሂደት በግላዊ GPU ሰርቨሮች ላይ ይከናወናል. የጽሑፍዎ ምዝገባ ወይም ከተሰጠ በኋላ የተፈጠረ ድምፅ አናስቀምጥም. ለክሎኒንግ የተጫኑ የድምፅ ምሳሌዎች ለወደፊቱ ክፍለ ጊዜ ብቻ ይጠቀማሉ እናም አይቆዩም. እኛ መረጃዎን በሶስተኛ ወገን ጋር አናጋራም ወይም ሞዴሎችን ለማስተማር እንጠቀማለን

አዎ. በ TTS.ai ላይ የተፈጠረው ድምፅ ሁሉ ለዩቲዩብ ቪዲዮዎች፣ ለፖድካስቶች፣ ለአውዲዮ መጽሐፍት፣ ለአፕሊኬሽኖች፣ ለገጾች እና ለምርቶች ጨምሮ ለኮሜርሺያል ጥቅም የሚውል ነው. ሞዴሎቻችን በፈቃድ ፈቃዶች (MIT, Apache 2.0) ስር የቀረቡ ናቸው። ምንም የባለቤትነት መብት ወይም ተቀባይነት የለም ፡፡

TTS.ai ለከፍተኛ ጥራት ድምፅን በWAV ቅርጸት ያወጣል. ነፃ የድምፅ መለወጫችንን በመጠቀም ወደ MP3፣ FLAC፣ OGG ወይም M4A መለወጥ ይችላሉ። API የተሻለውን የድምፅ ቅርጸት በቀጥታ በጠየቁት ውስጥ ማሳየት ይደግፋል

የድምፅ ቅደም ተከተል (ከ5 ሰከንዶች በታች) ለመክተት የምትፈልገውን የድምፅ ቅደም ተከተል ይጫኑ፣ ከዚያም በድምፅ ውስጥ ንግግርን ለመፍጠር ማንኛውንም ጽሑፍ ይጻፉ። እንደ ቻተርቦክስ፣ ጂፒቲ-ሶቪትስ፣ እና ኮሲቮይስ 2 ያሉ ሞዴሎች የድምፅ ቅደም ተከተልን ይደግፋሉ። የተከታተለው ድምፅ ድምፅን፣ ድምፅን እና የመናገር ዘይቤን ይይዛል።

ነጻ ሞዴሎች (ኮኮሮ, Piper, VITS, MeloTTS) ምንም መለያ አይጠይቁም እና የዝቅተኛ ፊደላት ዋጋ አላቸው. ስታንዳርድ ሞዴሎች (2,000 ፊደላት / 1K ምዝገባ) Bark, CosyVoice 2, F5-TTS, እና Dia ይዘው ይመጣሉ. ፕሪሚየም ሞዴሎች (4,000 ፊደላት / 1K ምዝገባ) OpenVoice, Chatterbox, StyleTTS 2, እና Tortoise ይዘው ይመጣሉ. የተከፈለ ሞዴሎች በዋናነት ከፍተኛ ጥራት ያላቸውን ፣ የበለጠ ድምጾችን እና እንደ ድምፅ ክሎኒንግ ያሉ ሌሎች ባህሪያትን ያቀርባሉ ፡፡

አዎ. ይህ API ትልቅ መጠን ያለውን ጽሑፍ ወደ ንግግር ለመለወጥ የቡት ሂደትን ይደግፋል. ብዙ ጥያቄዎችን ያቀርቡ እና የስራ UUIDsን በመጠቀም ውጤቶችን በተመሳሳይ ጊዜ ያግኙ. የድርጅት ዕቅዶች ($99 / ወር) ለፍጥነት የቡት ሂደትን ለማግኘት የቅድሚያ መስመር መዳረሻን ያካትታሉ. ለኦዲዮ መጽሐፍ ምርት፣ ለኮርስ ይዘት እና ለታላላቅ የድምፅ ፕሮጀክቶች ተስማሚ ነው.
4.0/5 (22)

ምን ማሻሻል እንችላለን? አስተያየቶችዎ ችግሮችን ለመፍታት ይረዳሉ.

ዛሬ AI ድምፅን ይጠቀሙ

TTS.aiን በመጠቀም ፈጣሪዎችን፣ ዳይቨሎፐሮችን እና ንግዶችን ይቀላቀሉ