ነጻ AI ጽሑፉን ወደ ንግግር ለውጥ

22+ ክፍት ምንጭ ሞዴሎች፣ 100+ ድምጾች፣ 32+ ቋንቋዎች.

0/500 ፊደላት ነጻ
የክሬዲት ካርድ የለም 50 ነጻ ክሬዲቶች 32+ ቋንቋዎች የንግድ ጥቅም
0:00 / 0:00
Download Audio መገናኛ በ24 ሰዓት ውስጥ ይቋረጣል
እንደ TTS.ai? ለጓደኞችህ ንገራቸው!

ለድምፅ AI የሚያስፈልግዎ ሁሉ

26 መሣሪያዎች በ 24+ ክፍት ምንጭ AI ሞዴሎች የተገነቡ

የድምፅ ሞዴሎች

በአንድ መድረክ ውስጥ የክፈት ምንጭ TTS ሞዴሎች በጣም የተሟላ መሰብሰብ

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

ምርጥ ለ: High-quality TTS with minimal latency, streaming applications

ነጻ ይሞክሩ

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

ምርጥ ለ: Quick previews, accessibility, and embedded applications

ነጻ ይሞክሩ

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

ምርጥ ለ: General-purpose text-to-speech with natural prosody

ነጻ ይሞክሩ

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

ምርጥ ለ: ምርት ፕሮግራሞች ፈጣን, ብዙ ቋንቋዎች TTS ያስፈልጋሉ

ነጻ ይሞክሩ

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

አዘጋጅ፦ Suno · ፈቃድ፦ MIT

ይሞክሩት

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

አዘጋጅ፦ Alibaba (Tongyi Lab) · ፈቃድ፦ Apache 2.0

ይሞክሩት

Dia TTS Standard

በብዙ ተናጋሪዎች መካከል ተፈጥሯዊ ውይይቶችን የሚፈጥረው የብዙ ተናጋሪ የዳያሎግ ማምረት ሞዴል

አዘጋጅ፦ Nari Labs · ፈቃድ፦ Apache 2.0

ይሞክሩት

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

አዘጋጅ፦ Hugging Face · ፈቃድ፦ Apache 2.0

ይሞክሩት

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

አዘጋጅ፦ Index Team · ፈቃድ፦ Apache 2.0

ይሞክሩት

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

አዘጋጅ፦ SparkAudio · ፈቃድ፦ Apache 2.0

ይሞክሩት

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

አዘጋጅ፦ RVC-Boss · ፈቃድ፦ MIT

ይሞክሩት

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

አዘጋጅ፦ Canopy Labs · ፈቃድ፦ Llama 3.2 Community

ይሞክሩት

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

አዘጋጅ፦ Alibaba (Qwen) · ፈቃድ፦ Apache 2.0

ይሞክሩት

Chatterbox Premium

ከResemble AI የተገኘውን ስሜት መቆጣጠርን ጨምሮ የቅርብ ጊዜውን የድምፅ ክሎኒንግ ያካትታል።

ጥራት፦

ይሞክሩት

Tortoise TTS Premium

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ ነው autoregressive አርክቴክቸር.

ጥራት፦

ይሞክሩት

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

ጥራት፦

ይሞክሩት

OpenVoice Premium

ቀስ በቀስ የድምፅ ክሎኒንግ ላይ ቅርፅ, ስሜት, እና accent ጋር granular ቁጥጥር.

ጥራት፦

ይሞክሩት

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ቋንቋዎች፦ en, zh, ja, ko, fr, de, it, es

ድምፅ

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

ቋንቋዎች፦ en, zh

ድምፅ

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

ቋንቋዎች፦ en, zh

ድምፅ

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

ቋንቋዎች፦ en, zh, ja, ko

ድምፅ

Chatterbox

ከResemble AI የተገኘውን ስሜት መቆጣጠርን ጨምሮ የቅርብ ጊዜውን የድምፅ ክሎኒንግ ያካትታል።

ቋንቋዎች፦ en

ድምፅ

Tortoise TTS

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ ነው autoregressive አርክቴክቸር.

ቋንቋዎች፦ en

ድምፅ

OpenVoice

ቀስ በቀስ የድምፅ ክሎኒንግ ላይ ቅርፅ, ስሜት, እና accent ጋር granular ቁጥጥር.

ቋንቋዎች፦ en, zh, ja, ko, fr, de, es, it

ድምፅ

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ቋንቋዎች፦ en, zh, ja, ko, de, fr, ru, pt, es, it

ድምፅ

የዲቨሎፐር-መጀመሪያ API

OpenAI-ተኳሃኝ REST API. አንድ መጨረሻ ነጥብ, 22+ ሞዴሎች. ለ እውነተኛ ጊዜ ፕሮግራሞች ስትሪሚንግ ድጋፍ.

  • ፋይል (_F)
  • ለወቅታዊ ፕሮግራሞች TTS ማስተላለፍ
  • ለታላላቅ ስራዎች የቡት ሂደት
  • የዌብሆክ ማስታወቂያዎች
ሰነዶችን አሳይ
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

ቀላል, ግልጽ ዋጋ

ነጻ ይጀምሩ. እንደምትጨምሩ መጠን ይጨምሩ.

ነጻ

$0

50 ክሬዲቶች

  • Kokoro, Piper, VITS, MeloTTS
  • ፊደል(ሎች)
  • 3 ጂን/ሰአት (አይቆጠራም)
ነጻ

መነሻ

$9/ወራት

ወር

  • ሁሉም 22+ ሞዴሎች
  • ፊደል(ሎች)
  • የድምፅ ክሎኒንግ
መጀመር
በጣም ተወዳጅ

$29/ወራት

ወር

  • ሁሉንም በጀምር
  • API መዳረሻ
  • አቀማመጥ
ፕሮፌሽናል

ኩባንያ

$99/ወራት

ወር

  • ሁሉንም በፕሮ
  • ብዛት፦
  • የፋይል ስም፦ (_F)
የሽያጭ ግንኙነት

View all plans including credit packs →

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

TTS.ai በጣም የተሟላ AI የድምፅ መድረክ ነው, 22+ ጽሑፍ-ወደ-ንግግር ሞዴሎችን, የድምፅ ክሎኒንግ, ንግግር-ወደ-ጽሑፍ, እና የድምፅ መሣሪያዎችን ያቀርባል. ሁሉም ሞዴሎች ነፃ ምንጭ ናቸው ምንም አቅራቢ lock-in.

አዎ! TTS.ai በኮኮሮ፣ በፒፐር፣ በቪቲኤስ እና በሜሎቲቲኤስ ሞዴሎች ነፃ የጽሑፍ-ወደ-ንግግር አገልግሎቶችን ያቀርባል። የግል መለያ አይጠየቅም። 50 ነፃ ክሬዲቶችን ለማግኘት እና ሁሉንም ሞዴሎች ለማግኘት ይመዝገቡ። የተከፈሉት ዕቅዶች በ $9 / ወር ይጀምራሉ ፡፡

ለፍጥነት ኮኮሮን ወይም ፒፐርን ይጠቀሙ። ለጥራት ኮሲቮይስ 2 ወይም ስታይልቲቲኤስ 2 ይሞክሩ። ለድምፅ ክሎኒንግ ቻተርቦክስን ወይም ጂፒቲ-ሶቪትስን ይጠቀሙ። ለዳያሎግ ዲያ ቲቲኤስ ይጠቀሙ። ለማነፃፀር በተመሳሳይ ጽሑፍ ላይ ብዙ ሞዴሎችን ይሞክሩ።

አዎ. OpenAI-ተኳሃኝ REST API ለ TTS, STT, የድምፅ ክሎኒንግ, እና የድምፅ መሣሪያዎች. በፕሮ ($ 29 / ወር) እና ኢንተርፕራይዝ ($ 99 / ወር) ዕቅዶች ላይ ይገኛል. tts.ai / api / ላይ ሰነዶችን ይመልከቱ.

የድምፅ ጥራት በሞዴል ይለያያል። እንደ ኮሲቮይስ 2፣ ስታይልቲቲኤስ 2፣ እና ቻተርቦክስ ያሉ የፕሪሚየም ሞዴሎች ከሰው ጋር ተመሳሳይ የድምፅ ጥራት ያላቸውን ቃላት በባህላዊ ድምፅና ስሜት ያቀርባሉ። እንደ ኮኮሮ ያሉ ነፃ ሞዴሎች ለብዙዎቹ የመጠቀም ጉዳዮች ምርጥ ጥራት ያቀርባሉ።

TTS.ai 30+ ቋንቋዎችን በሞዴል መዝገብ ቤቱ ውስጥ ይደግፋል። እንግሊዝኛ ትልቁን የሞዴል ድጋፍ አለው ፣ ግን እንደ ኮሲቮይስ 2 ያሉ ሞዴሎች ቻይንኛ ፣ ጃፓንኛ እና ኮሪያን ይሸፍናሉ ፡፡ GPT-SoVITS ቻይንኛ ፣ ጃፓንኛ ፣ ኮሪያን እና እንግሊዝኛን ይይዛል ፡፡ እና MeloTTS ቻይንኛ ፣ ስፓኒሽ ፣ ፈረንሳይኛ ፣ ቻይንኛ ፣ ጃፓንኛ እና ኮሪያን ይደግፋል ፡፡

አዎ. ሁሉንም ሂደቶች በግላዊ GPU ሰርቨሮቻችን ላይ ይከናወናሉ. የጽሑፍ ማስገባትዎን ወይም ከተሰጠ በኋላ የተፈጠረውን ድምፅ አናስቀምጥም. ለክሎኒንግ የተጫኑ የድምፅ ምሳሌዎች ለወደፊቱ ክፍለ ጊዜ ብቻ ይጠቀማሉ እናም አይጠበቁም. መረጃዎን ከሶስተኛ ወገን ጋር አናጋራም ወይም ሞዴሎችን ለማስተማር አንጠቀምም.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai ድምፅ በ WAV ቅርጸት በመደበኛነት ከፍተኛ ጥራት ለማግኘት ይፈጥራል. ወደ MP3, FLAC, OGG, ወይም M4A ነፃ የድምፅ መለወጫ መሳሪያችንን በመጠቀም መለወጥ ይችላሉ. የ API በጥያቄው ውስጥ ቀጥታ የተሻለው ውጤት ቅርጸትዎን በመግለጽ ይደግፋል.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

ነጻ ሞዴሎች (ኮኮሮ, ፒፐር, VITS, MeloTTS) ምንም መለያ አይጠይቁም እና 0 ክሬዲቶችን ያስከፍላሉ. መደበኛ ሞዴሎች (2 ክሬዲቶች / 1K ፊደላት) Bark, CosyVoice 2, F5-TTS, እና Dia ያካትታሉ. ፕሪሚየም ሞዴሎች (4 ክሬዲቶች / 1K ፊደላት) OpenVoice, Chatterbox, StyleTTS 2, እና Tortoise ያካትታሉ. የተከፈለ ሞዴሎች በዋናነት ከፍተኛ ጥራት ያላቸውን ፣ የበለጠ ድምጾችን እና እንደ ድምፅ ክሎኒንግ ያሉ ሌሎች ባህሪያትን ያቀርባሉ ፡፡

አዎ. ይህ API ትልቅ መጠን ያለውን ጽሑፍ ወደ ንግግር ለመለወጥ የቡት ሂደትን ይደግፋል. ብዙ ጥያቄዎችን ያቀርቡ እና የስራ UUIDsን በመጠቀም ውጤቶችን በተመሳሳይ ጊዜ ያግኙ. የድርጅት ዕቅዶች ($99 / ወር) ለፍጥነት የቡት ሂደትን ለማግኘት የቅድሚያ መስመር መዳረሻን ያካትታሉ. ለኦዲዮ መጽሐፍ ምርት፣ ለኮርስ ይዘት እና ለታላላቅ የድምፅ ፕሮጀክቶች ተስማሚ ነው.
5.0/5 (1)

ዛሬ AI ድምፅን ይጠቀሙ

በቲቲኤስ.አይ በመጠቀም ፈጣሪዎችን፣ ዲቨሎፕመንቶችን እና ንግዶችን ይቀላቀሉ