AI ฟรี ข้อความเป็นเสียงName
22+ แบบจำลองโอเพนซอร์ส 100+ เสียง 32+ ไม่จำเป็นต้องมีบัญชี
ทุกอย่างที่คุณต้องการสำหรับ AI เสียง
เครื่องมือ 26 เครื่อง ใช้โมเดล AI แบบโอเพนซอร์สมากกว่า 24 แบบ
ตัวอย่างเสียง AI มากกว่า 22 ตัว
การรวบรวมแบบจำลอง TTS แบบโอเพนซอร์สที่ครอบคลุมที่สุดในแพลตฟอร์มเดียว
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
เหมาะสำหรับ: High-quality TTS with minimal latency, streaming applications
ลองใช้ฟรี
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
เหมาะสำหรับ: Quick previews, accessibility, and embedded applications
ลองใช้ฟรี
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
เหมาะสำหรับ: General-purpose text-to-speech with natural prosody
ลองใช้ฟรี
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
เหมาะสำหรับ: แอพพลิเคชันการผลิตที่ต้องการ TTS หลายภาษาอย่างรวดเร็ว
ลองใช้ฟรี
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ผู้พัฒนา: Suno · ใบอนุญาต MIT
ลองดูสิ
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
ผู้พัฒนา: Suno · ใบอนุญาต MIT
ลองดูสิ
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ผู้พัฒนา: Alibaba (Tongyi Lab) · ใบอนุญาต Apache 2.0
ลองดูสิ
Dia TTS Standard
โมเดลการสร้างการสนทนาของผู้พูดหลายคนที่สร้างการสนทนาตามธรรมชาติระหว่างผู้พูด
ผู้พัฒนา: Nari Labs · ใบอนุญาต Apache 2.0
ลองดูสิ
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
ผู้พัฒนา: Hugging Face · ใบอนุญาต Apache 2.0
ลองดูสิ
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ผู้พัฒนา: Index Team · ใบอนุญาต Apache 2.0
ลองดูสิ
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
ผู้พัฒนา: SparkAudio · ใบอนุญาต Apache 2.0
ลองดูสิ
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
ผู้พัฒนา: RVC-Boss · ใบอนุญาต MIT
ลองดูสิ
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
ผู้พัฒนา: Canopy Labs · ใบอนุญาต Llama 3.2 Community
ลองดูสิ
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ผู้พัฒนา: Alibaba (Qwen) · ใบอนุญาต Apache 2.0
ลองดูสิ
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ภาษา: en, zh, ja, ko, fr, de, it, es
โคลนเสียง
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ภาษา: en, zh
โคลนเสียง
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
ภาษา: en, zh
โคลนเสียง
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
ภาษา: en, zh, ja, ko
โคลนเสียง
OpenVoice
โคลนเสียงในทันที ด้วยการควบคุมสไตล์ อารมณ์ และสำเนียง
ภาษา: en, zh, ja, ko, fr, de, es, it
โคลนเสียง
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ภาษา: en, zh, ja, ko, de, fr, ru, pt, es, it
โคลนเสียงAPI สำหรับผู้พัฒนา
REST API ที่เข้ากันได้กับ OpenAI จุดสิ้นสุดหนึ่ง โมเดลมากกว่า 22 ตัว สนับสนุนการสตรีมสำหรับแอพพลิเคชันในเวลาจริง
- รูปแบบที่รองรับ OpenAI
- การสตรีม TTS สำหรับแอปพลิเคชันเวลาจริง
- ประมวลผลเป็นกลุ่มสำหรับงานขนาดใหญ่
- การแจ้งให้ทราบของ Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
ราคาที่เรียบง่ายและโปร่งใส
เริ่มต้นฟรี ปรับขนาดตามที่คุณเติบโต
ว่าง
50 เครดิต
- Kokoro, Piper, VITS, MeloTTS
- จำกัดตัวอักษร 500 ตัว
- 3 gen/ ชั่วโมง (ไม่มีบัญชี)
เริ่มการทำงาน
500 เครดิต/เดือน
- ทั้งหมด 22+ รุ่น
- จำกัดตัวอักษร 5,000 ตัว
- การคัดลอกเสียง
โปร
2,000 เครดิต/เดือน
- ทุกอย่างใน Starter
- การเข้าถึง API
- การประมวลผลความสำคัญ
เอ็นเตอร์ไพรส์
10,000 เครดิต/เดือน
- ทุกอย่างในโปร
- บล๊อก API
- คิวที่ให้ความสำคัญ
คำถามที่ถามบ่อย
เริ่มใช้ AI Voice วันนี้เลย
ร่วมมือกับผู้สร้าง นักพัฒนา และธุรกิจที่ใช้ TTS.ai