AI ឥតគិតថ្លៃ អត្ថបទ​ទៅ​ការ​និយាយ

22+ ម៉ូដែលប្រភពបើកចំហ, 100+ សំឡេង, 32+ ភាសា & # 160; ។ មិន​ត្រូវការ​គណនី​ទេ & # 160; ។

0/500 តួអក្សរ ទំនេរ
គ្មាន​កាត​ឥណទាន 50 ឥណទានដោយឥតគិតថ្លៃ 32+ ភាសា ការ​ប្រើ​ពាណិជ្ជកម្ម យល់ព្រម
0:00 / 0:00
Download Audio តំណផុតកំណត់ក្នុង 24h
ចូលចិត្ត TTS.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

អ្វី​គ្រប់យ៉ាង​ដែល​អ្នក​ត្រូវការ​សម្រាប់ AI សំឡេង

26 ឧបករណ៍ដែលមានថាមពលដោយ 24+ ម៉ូដែល AI ប្រភពបើកចំហ

ម៉ូដែល​សំឡេង AI 22+

ការ​ប្រមូល​ផ្ដុំ​ដ៏​ទូលំទូលាយ​បំផុត​នៃ​ម៉ូដែល TTS ប្រភព​បើកចំហ​ក្នុង​វេទិកា​មួយ

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

ល្អបំផុត​សម្រាប់ & # 160; ៖ High-quality TTS with minimal latency, streaming applications

សាកល្បង​ដោយ​ឥត​គិតថ្លៃ

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

ល្អបំផុត​សម្រាប់ & # 160; ៖ Quick previews, accessibility, and embedded applications

សាកល្បង​ដោយ​ឥត​គិតថ្លៃ

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

ល្អបំផុត​សម្រាប់ & # 160; ៖ General-purpose text-to-speech with natural prosody

សាកល្បង​ដោយ​ឥត​គិតថ្លៃ

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

ល្អបំផុត​សម្រាប់ & # 160; ៖ កម្មវិធី​ផលិតកម្ម​ដែល​ត្រូវការ TTS រហ័ស និង​ច្រើន​ភាសា

សាកល្បង​ដោយ​ឥត​គិតថ្លៃ

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ ៖ MIT

សាកល្បង

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ ៖ MIT

សាកល្បង

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Tongyi Lab) · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

Dia TTSDia TTS Standard

ម៉ូដែល​បង្កើត​ប្រអប់​អ្នក​និយាយ​ច្រើន​ដែល​បង្កើត​ការ​សន្ទនា​ធម្មជាតិ​រវាង​អ្នក​និយាយ & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Hugging Face · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Index Team · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ SparkAudio · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ RVC-Boss · អាជ្ញាបណ្ណ ៖ MIT

សាកល្បង

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Canopy Labs · អាជ្ញាបណ្ណ ៖ Llama 3.2 Community

សាកល្បង

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Qwen) · អាជ្ញាបណ្ណ ៖ Apache 2.0

សាកល្បង

ChatterboxChatterbox Premium

ការ​ចម្លង​សំឡេង​សូន្យ​ដោយ​ប្រើ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ពី Resemble AI ។

គុណភាព & # 160; ៖

សាកល្បង

Tortoise TTSTortoise TTS Premium

អត្ថបទ​ទៅ​ការ​និយាយ​សំឡេង​ច្រើន​ផ្តោត​លើ​គុណភាព​ជាមួយ​ស្ថាបត្យកម្ម autoregressive ។

គុណភាព & # 160; ៖

សាកល្បង

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

គុណភាព & # 160; ៖

សាកល្បង

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

គុណភាព & # 160; ៖

សាកល្បង

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ភាសា ៖ en, zh, ja, ko, fr, de, it, es

ក្លូន​សំឡេង

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

ភាសា ៖ en, zh

ក្លូន​សំឡេង

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

ភាសា ៖ en, zh

ក្លូន​សំឡេង

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

ភាសា ៖ en, zh, ja, ko

ក្លូន​សំឡេង

ChatterboxChatterbox

ការ​ចម្លង​សំឡេង​សូន្យ​ដោយ​ប្រើ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ពី Resemble AI ។

ភាសា ៖ en

ក្លូន​សំឡេង

Tortoise TTSTortoise TTS

អត្ថបទ​ទៅ​ការ​និយាយ​សំឡេង​ច្រើន​ផ្តោត​លើ​គុណភាព​ជាមួយ​ស្ថាបត្យកម្ម autoregressive ។

ភាសា ៖ en

ក្លូន​សំឡេង

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

ភាសា ៖ en, zh, ja, ko, fr, de, es, it

ក្លូន​សំឡេង

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ភាសា ៖ en, zh, ja, ko, de, fr, ru, pt, es, it

ក្លូន​សំឡេង

API ដំបូង​របស់​អ្នក​អភិវឌ្ឍន៍

REST API ឆបគ្នាជាមួយ OpenAI ។ ចំណុចបញ្ចប់មួយ ម៉ូដែល 22 + ។ ការគាំទ្រស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត ។

  • ទ្រង់ទ្រាយ​ឆបគ្នា​ជាមួយ OpenAI
  • ស្ទ្រីម TTS សម្រាប់​កម្មវិធី​ពេលវេលា​ពិត
  • ការ​ដំណើរការ​បាច់​សម្រាប់​ការងារ​ធំៗ
  • ការ​ជូនដំណឹង Webhook
មើល​ឯកសារ API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

សាមញ្ញ, ការ​កំណត់​តម្លៃ​ថ្លា

ចាប់ផ្ដើម​ដោយ​ឥត​គិត​ថ្លៃ & # 160; ។ ធ្វើ​មាត្រដ្ឋាន​តាម​ដែល​អ្នក​រីកចម្រើន & # 160; ។

ទំនេរ

$0

៥០ ក្រេឌីត

  • Kokoro, Piper, VITS, MeloTTS
  • ដែន​កំណត់​តួអក្សរ ៥០០
  • 3 gen/ ម៉ោង (គ្មានគណនី)
ចុះឈ្មោះដោយឥតគិតថ្លៃ

កម្មវិធី​ចាប់ផ្ដើម

$9/​ខែ

500 ក្រេឌីត / ខែ

  • ម៉ូដែល 22+ ទាំងអស់
  • ដែន​កំណត់​តួអក្សរ ៥, ០០០
  • ការ​ក្លូន​សំឡេង
ចាប់ផ្ដើម
ពេញនិយម​បំផុត

ជំនាញ

$29/​ខែ

2,000 ក្រេឌីត / ខែ

  • ទាំងអស់​នៅ​ក្នុង​កម្មវិធី​ចាប់ផ្ដើម
  • ការ​ចូលដំណើរការ API
  • ដំណើរការ​អាទិភាព
ទទួលបាន​អ្នក​ជំនាញ

សហគ្រាស

$99/​ខែ

10,000 ក្រេឌីត / ខែ

  • អ្វីៗ​ទាំងអស់​នៅ​ក្នុង Pro
  • API ច្រើន
  • ជួរ​អាទិភាព
ទំនាក់ទំនង​ការ​លក់

View all plans including credit packs →

សំណួរ​ដែល​សួរ​ញឹកញាប់

TTS.ai គឺជាវេទិកាសំឡេង AI ដ៏ទូលំទូលាយបំផុតដែលផ្តល់ជូន 22+ ម៉ូដែលអត្ថបទទៅជាសំឡេង ការចម្លងសំឡេង ការនិយាយទៅជាអត្ថបទ និងឧបករណ៍អូឌីយ៉ូ។ ម៉ូដែលទាំងអស់គឺជាប្រភពបើកចំហដោយគ្មានការចាក់សោក្រុមហ៊ុនលក់។

បាទ! TTS.ai ផ្តល់ជូនអត្ថបទ-ទៅ-ការនិយាយដោយឥតគិតថ្លៃជាមួយ Kokoro, Piper, VITS, និងម៉ូដែល MeloTTS. គ្មានគណនីចាំបាច់. ចុះឈ្មោះដើម្បីទទួលបាន 50 ឥណទានឥតគិតថ្លៃនិងចូលដំណើរការម៉ូដែលទាំងអស់. ផែនការដែលបានបង់ចាប់ផ្តើមនៅ $9 / ខែ.

សម្រាប់​ល្បឿន ប្រើ Kokoro ឬ Piper & # 160; ។ សម្រាប់​គុណភាព ព្យាយាម CosyVoice2ឬ StyleTTS2& # 160; ។ សម្រាប់​ក្លូន​សំឡេង ប្រើ Chatterbox ឬ GPT- SoVITS & # 160; ។ សម្រាប់​ប្រអប់ ប្រើ Dia TTS & # 160; ។ ព្យាយាម​ម៉ូដែល​ច្រើន​លើ​អត្ថបទ​ដូចគ្នា​ដើម្បី​ប្រៀបធៀប & # 160; ។

បាទ / ចាស។ REST API ដែលឆបគ្នាជាមួយ OpenAI សម្រាប់ TTS, STT, ការចម្លងសំឡេងនិងឧបករណ៍អូឌីយ៉ូ។ មាននៅលើផែនការ Pro ($29 / mo) និង Enterprise ($99 / mo) ។ មើលឯកសារនៅ tts.ai/api/ ។

គុណភាព​សំឡេង​ប្រែប្រួល​ទៅ​តាម​ម៉ូដែល ។ ម៉ូដែល​ពិសេស​ដូចជា CosyVoice 2, StyleTTS 2, និង Chatterbox ផលិត​ការ​និយាយ​ដែល​មាន​គុណភាព​ជិត​មនុស្ស​ជាមួយ​នឹង​ការ​បញ្ចេញ​សំឡេង និង​អារម្មណ៍​ធម្មជាតិ ។ ម៉ូដែល​ឥត​គិត​ថ្លៃ​ដូចជា Kokoro ផ្តល់ជូន​គុណភាព​ល្អ​សម្រាប់​ករណី​ប្រើ​ច្រើន​បំផុត ។

TTS.ai supports 30+ languages across its model library. English has the widest model support, but models like CosyVoice 2 cover Chinese, Japanese, and Korean; GPT-SoVITS handles Chinese, Japanese, Korean, and English; and MeloTTS supports English, Spanish, French, Chinese, Japanese, and Korean.

បាទ/ ចាស & # 160; ។ ការ​ដំណើរការ​ទាំងអស់​កើត​ឡើង​នៅ​លើ​ម៉ាស៊ីន​បម្រើ GPU ដែល​បាន​បម្រុង​ទុក​របស់​យើង & # 160; ។ យើង​មិន​រក្សា​ទុក​ការ​បញ្ចូល​អត្ថបទ​របស់​អ្នក ឬ​អូឌីយ៉ូ​ដែល​បាន​បង្កើត​បន្ទាប់​ពី​ការ​ចែកចាយ & # 160; ។ ឧទាហរណ៍​សំឡេង​ដែល​បាន​ផ្ទុក​ឡើង​សម្រាប់​ការ​ក្លូន​ត្រូវ​បាន​ប្រើ​តែ​សម្រាប់​សម័យ​បច្ចុប្បន្ន​ប៉ុណ្ណោះ ហើយ​មិន​ត្រូវ​បាន​រក្សា​ទុក & # 160; ។ យើង​មិន​ដែល​ចែក​រំលែក​ទិន្នន័យ​របស់​អ្នក​ជាមួយ​ភាគី​ទីបី ឬ​ប្រើ​វា​ដើម្បី​ហ្វឹកហាត់​ម៉ូដែល & # 160; ។

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai បង្កើតអូឌីយ៉ូនៅក្នុងទ្រង់ទ្រាយ WAV ដោយលំនាំដើមសម្រាប់គុណភាពអតិបរមា. អ្នកអាចបម្លែងទៅជា MP3, FLAC, OGG, ឬ M4A ដោយប្រើឧបករណ៍បម្លែងអូឌីយ៉ូឥតគិតថ្លៃរបស់យើង. API គាំទ្រការបញ្ជាក់ទ្រង់ទ្រាយលទ្ធផលដែលអ្នកចូលចិត្តដោយផ្ទាល់នៅក្នុងសំណើ.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

ម៉ូដែលឥតគិតថ្លៃ (Kokoro, Piper, VITS, MeloTTS) មិន ត្រូវការ គណនី និង ចំណាយ សូន្យ ពិន្ទុ. ម៉ូដែលស្តង់ដារ (2 ពិន្ទុ / 1K តួអក្សរ) រួមមាន Bark, CosyVoice2, F5-TTS, និង Dia. ម៉ូដែលប្រាក់រង្វាន់ (4 ពិន្ទុ / 1K តួអក្សរ) រួមមាន OpenVoice, Chatterbox, StyleTTS2, និង Tortoise. ម៉ូដែលដែលបង់ប្រាក់ជាទូទៅផ្តល់ជូននូវគុណភាពខ្ពស់, សំឡេងច្រើន, និង លក្ខណៈពិសេសបន្ថែមដូចជាការចម្លងសំឡេង.

បាទ / ចាស. API គាំទ្រការដំណើរការ batch សម្រាប់បម្លែងបរិមាណធំនៃអត្ថបទទៅជាសំឡេង. ដាក់ស្នើសំណើច្រើននិងទាញយកលទ្ធផល asynchronously ដោយប្រើការងារ UUIDs. ផែនការសហគ្រាស ($99 / ខែ) រួមបញ្ចូលការចូលដំណើរការជួរអាទិភាពសម្រាប់ដំណើរការ batch រហ័ស. ល្អសម្រាប់ផលិតកម្មសៀវភៅអូឌីយ៉ូ, មាតិកាវគ្គសិក្សានិងគម្រោង voiceover ធំ.
5.0/5 (1)

ចាប់ផ្ដើម​ប្រើ​សំឡេង AI ថ្ងៃនេះ

ចូលរួមជាមួយអ្នកបង្កើតអ្នកអភិវឌ្ឍន៍និងអាជីវកម្មដោយប្រើ TTS.ai