නිදහස් AI පෙළ සිට කථාවName

22+ විවෘත මූලාශ්රය ආකෘති, 100+ හඬ, 32+ භාෂා. ගිණුමක් අවශ්ය නැත.

0/500 අකුරු නිදහස්
ක්‍රෙඩිට් කාඩ් නැත 50 නොමිලේ ණය 32+ භාෂා වාණිජමය භාවිතය OK
0:00 / 0:00
Download Audio සබැඳිය 24h දී කල් ඉකුත් වේ
TTS.ai වගේ? ඔබේ මිතුරන්ට කියන්න!

හඬ AI සඳහා ඔබට අවශ්ය සියල්ල

24+ විවෘත මූලාශ්රය AI ආකෘති මගින් බලගැන්වෙන මෙවලම් 26

22+ AI හඬ ආකෘති

එක් වේදිකාවක විවෘත මූලාශ්රය TTS ආකෘති වඩාත් පුළුල් එකතුව

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

සඳහා හොඳම: High-quality TTS with minimal latency, streaming applications

නොමිලේ උත්සාහ කරන්න

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

සඳහා හොඳම: Quick previews, accessibility, and embedded applications

නොමිලේ උත්සාහ කරන්න

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

සඳහා හොඳම: General-purpose text-to-speech with natural prosody

නොමිලේ උත්සාහ කරන්න

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

සඳහා හොඳම: වේගවත්, බහුභාෂා TTS අවශ්ය නිෂ්පාදන යෙදුම්

නොමිලේ උත්සාහ කරන්න

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

සංවර්‍ධක: Alibaba (Tongyi Lab) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Dia TTS Standard

ස්වාභාවික භාෂා පරිවර්තනය යනු ස්වාභාවික භාෂා ව්‍යවහාරයෙහි ස්වාභාවික භාෂා පරිවර්තනයයි.

සංවර්‍ධක: Nari Labs · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

සංවර්‍ධක: Hugging Face · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

සංවර්‍ධක: Index Team · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

සංවර්‍ධක: SparkAudio · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

සංවර්‍ධක: RVC-Boss · බලපත්‍රය: MIT

උත්සහ කරන්න.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

සංවර්‍ධක: Canopy Labs · බලපත්‍රය: Llama 3.2 Community

උත්සහ කරන්න.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

සංවර්‍ධක: Alibaba (Qwen) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Chatterbox Premium

ශුන්‍ය-ෂොට් හඬ ක්ලෝන කිරීම, Resemble AI වලින් හැඟීම් පාලනය කිරීම.

තත්ත්ව:

උත්සහ කරන්න.

Tortoise TTS Premium

බහු-හඬ පෙළ-කථාව ගුණාත්මකභාවය කෙරෙහි අවධානය යොමු කරන ස්වයංක්‍රීය ප්‍රතික්‍රියාකාරී ගෘහ නිර්මාණ ශිල්පය.

තත්ත්ව:

උත්සහ කරන්න.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

තත්ත්ව:

උත්සහ කරන්න.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

තත්ත්ව:

උත්සහ කරන්න.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

භාෂා: en, zh, ja, ko, fr, de, it, es

හඬ ක්ලෝන කරන්න

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

භාෂා: en, zh, ja, ko

හඬ ක්ලෝන කරන්න

Chatterbox

ශුන්‍ය-ෂොට් හඬ ක්ලෝන කිරීම, Resemble AI වලින් හැඟීම් පාලනය කිරීම.

භාෂා: en

හඬ ක්ලෝන කරන්න

Tortoise TTS

බහු-හඬ පෙළ-කථාව ගුණාත්මකභාවය කෙරෙහි අවධානය යොමු කරන ස්වයංක්‍රීය ප්‍රතික්‍රියාකාරී ගෘහ නිර්මාණ ශිල්පය.

භාෂා: en

හඬ ක්ලෝන කරන්න

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

භාෂා: en, zh, ja, ko, fr, de, es, it

හඬ ක්ලෝන කරන්න

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

භාෂා: en, zh, ja, ko, de, fr, ru, pt, es, it

හඬ ක්ලෝන කරන්න

සංවර්ධක- පළමු API

OpenAI අනුකූල REST API. එක් අවසන් ස්ථානයක්, 22+ ආකෘති. සැබෑ-කාලීන යෙදුම් සඳහා ප් රවාහනය සහාය.

  • OpenAI අනුකූල සංයුතිය
  • සත්‍ය කාලීන යෙදුම් සඳහා TTS ප්රවාහනය
  • විශාල වැඩ සඳහා බැච් සැකසීම
  • Webhook දැනුම්දීම්
API ලේඛන බලන්න
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

සරල, විනිවිද මිල ගණන්

නිදහස් ආරම්භ කරන්න. ඔබ වර්ධනය ලෙස පරිමාණය.

නිදහස්

$0

50 කාඩ්පත්

  • Kokoro, Piper, VITS, MeloTTS
  • අකුරු සීමා 500
  • 3 gen / පැය (ගැණුම්කරුවන් නැත)
නොමිලේ ලියාපදිංචි

ආරම්භකය

$9/මිනිත්තු

500 ණය / මාස

  • සියලු 22+ ආකෘති
  • 5,000 අකුරු සීමාව
  • හඬ ක්ලෝන කිරීම
ආරම්භ කරන්න
ජනප්‍රියම

ප්‍රො

$29/මිනිත්තු

2,000 ණය / මාස

  • ආරම්භකයේ ඇති සියල්ල
  • API පිවිසුම
  • ප්‍රමුඛතාව සැකසීම
වෘත්තීය ලබා ගන්න

එන්ටර්ප්‍රයිස්

$99/මිනිත්තු

10,000 ණය / මාස

  • හැම දෙයක්ම Pro
  • තොග API
  • ප්‍රමුඛතා පෙළ
අලෙවි අමතන්න

View all plans including credit packs →

නිතර අසන ප්රශ්න

TTS.ai වඩාත් පුළුල් AI හඬ වේදිකාව, 22+ පෙළ-කථාව ආකෘති, හඬ ක්ලෝන, කථාව-පෙළ, සහ ශ්රව්ය මෙවලම් ලබා දෙයි. සියලුම ආකෘති කිසිදු විකුණුම්කරු අගුලු සමග විවෘත මූලාශ්රය වේ.

ඔව්! TTS.ai Kokoro සමග නොමිලේ පෙළ-කතා ඉදිරිපත් කරයි, Piper, VITS, සහ MeloTTS ආකෘති. කිසිදු ගිණුමක් අවශ්ය. ලබා ගැනීමට ලියාපදිංචි 50 නොමිලේ ණය සහ සියලු ආකෘති ප්රවේශ. ගෙවන සැලසුම් $9/month දී ආරම්භ.

වේගය සඳහා, Kokoro හෝ Piper භාවිතා කරන්න. ගුණාත්මකභාවය සඳහා, CosyVoice2හෝ StyleTTS 2. හඬ ක්ලෝන කිරීම සඳහා, Chatterbox හෝ GPT-SoVITS භාවිතා කරන්න. සංවාදය සඳහා, Dia TTS භාවිතා කරන්න. සංසන්දනය කිරීමට එකම පෙළ මත බහු ආකෘති උත්සාහ කරන්න.

ඔව්. TTS සඳහා OpenAI අනුකූල REST API, STT, හඬ ක්ලෝන, සහ ශ්රව්ය මෙවලම්. Pro ($29/mo) සහ Enterprise ($99/mo) සැලසුම් මත ලබා ගත හැකිය. tts.ai/api/ හි ලේඛන බලන්න.

හඬ ගුණාත්මකභාවය ආකෘතිය අනුව වෙනස් වේ. CosyVoice වැනි වාරික ආකෘති2, StyleTTS2, සහ Chatterbox ස්වභාවික intonation හා හැඟීම් සමග ආසන්න-මානව ගුණාත්මක භාවය කථාව නිෂ්පාදනය. Kokoro වැනි නිදහස් ආකෘති බොහෝ භාවිතය නඩු සඳහා විශිෂ්ට ගුණාත්මක ඉදිරිපත් කරයි.

TTS.ai supports 30+ languages across its model library. English has the widest model support, but models like CosyVoice 2 cover Chinese, Japanese, and Korean; GPT-SoVITS handles Chinese, Japanese, Korean, and English; and MeloTTS supports English, Spanish, French, Chinese, Japanese, and Korean.

ඔව්. සියලු සැකසුම් අපගේ කැප GPU සේවාදායක මත සිදු වේ. අපි භාරදීමෙන් පසු ඔබේ පෙළ ආදාන හෝ ජනනය ශ්රව්ය ගබඩා කරන්නේ නැහැ. ක්ලෝන සඳහා උඩුගත හඬ සාම්පල වත්මන් සැසිය සඳහා පමණක් භාවිතා වන අතර තබා නැත. අපි තෙවන පාර්ශවයන් සමඟ ඔබේ දත්ත හුවමාරු හෝ ආකෘති පුහුණු කිරීමට එය භාවිතා කරන්නේ නැහැ.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai උපරිම ගුණාත්මකභාවය සඳහා පෙරනිමියෙන් WAV ආකෘතියෙන් ශ්රව්ය ජනනය. ඔබ MP3 බවට පරිවර්තනය කළ හැකිය, FLAC, OGG, හෝ අපගේ නිදහස් ශ්රව්ය Converter මෙවලම භාවිතා M4A. මෙම API ඉල්ලීම ඔබේ ප්රියතම ප්රතිදානය ආකෘතිය සෘජුවම සඳහන් සහාය.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) කිසිදු ගිණුමක් අවශ්ය හා ශුන්‍ය ක්රෙඩිට් පිරිවැය. සම්මත ආකෘති (2 ක්රෙඩිට් / 1K අක්ෂර) බර්ක් ඇතුළත්, CosyVoice2, F5-TTS, හා Dia. ප් රදාන ආකෘති (4 ක්රෙඩිට් / 1K අක්ෂර) OpenVoice ඇතුළත්, Chatterbox, StyleTTS2, හා Tortoise. ගෙවන ආකෘති සාමාන්යයෙන් උසස් තත්ත්වයේ ලබා, වැඩි හඬ, හා හඬ ක්ලෝන වැනි අමතර විශේෂාංග.

ඔව්. මෙම API කතා කිරීමට පෙළ විශාල පරිමාවක් පරිවර්තනය කිරීම සඳහා කණ්ඩායම් සැකසීම සහාය. බහු ඉල්ලීම් ඉදිරිපත් හා රැකියා UUIDs භාවිතා කරමින් සමමුහුර්තව ප්රතිඵල ලබා ගන්න. ව්යාපාර සැලසුම් ($99/mo) වේගවත් කණ්ඩායම් සැකසීම සඳහා ප්රමුඛතාවය පෝලිම ප්රවේශය ඇතුළත්. ශ්රව්ය පොත් නිෂ්පාදනය සඳහා පරිපූර්ණ, පාඨමාලාව අන්තර්ගතය, සහ විශාල ප්රමාණයක් voiceover ව්යාපෘති.
5.0/5 (1)

අද AI හඬ භාවිතා කිරීම ආරම්භ කරන්න

නිර්මාණකරුවන් එක්වන්න, සංවර්ධකයින්, සහ TTS.ai භාවිතා ව්යාපාර