AI ฟรี ข้อความเป็นเสียงName

22+ แบบจำลองโอเพนซอร์ส 100+ เสียง 32+ ไม่จำเป็นต้องมีบัญชี

0/500 ตัวอักษร ว่าง
ไม่มีบัตรเครดิต 50 เครดิตฟรี 32+ ภาษา ใช้เพื่อการค้า โอเค
0:00 / 0:00
ดาวน์โหลดเพลง ลิงก์หมดอายุใน 24 ชั่วโมง
เหมือน TTS.ai บอกเพื่อนของคุณ

ทุกอย่างที่คุณต้องการสำหรับ AI เสียง

เครื่องมือ 26 เครื่อง ใช้โมเดล AI แบบโอเพนซอร์สมากกว่า 24 แบบ

ตัวอย่างเสียง AI มากกว่า 22 ตัว

การรวบรวมแบบจำลอง TTS แบบโอเพนซอร์สที่ครอบคลุมที่สุดในแพลตฟอร์มเดียว

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

เหมาะสำหรับ: High-quality TTS with minimal latency, streaming applications

ลองใช้ฟรี

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

เหมาะสำหรับ: Quick previews, accessibility, and embedded applications

ลองใช้ฟรี

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

เหมาะสำหรับ: General-purpose text-to-speech with natural prosody

ลองใช้ฟรี

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

เหมาะสำหรับ: แอพพลิเคชันการผลิตที่ต้องการ TTS หลายภาษาอย่างรวดเร็ว

ลองใช้ฟรี

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ผู้พัฒนา: Suno · ใบอนุญาต MIT

ลองดูสิ

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

ผู้พัฒนา: Suno · ใบอนุญาต MIT

ลองดูสิ

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ผู้พัฒนา: Alibaba (Tongyi Lab) · ใบอนุญาต Apache 2.0

ลองดูสิ

Dia TTSDia TTS Standard

โมเดลการสร้างการสนทนาของผู้พูดหลายคนที่สร้างการสนทนาตามธรรมชาติระหว่างผู้พูด

ผู้พัฒนา: Nari Labs · ใบอนุญาต Apache 2.0

ลองดูสิ

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

ผู้พัฒนา: Hugging Face · ใบอนุญาต Apache 2.0

ลองดูสิ

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

ผู้พัฒนา: Index Team · ใบอนุญาต Apache 2.0

ลองดูสิ

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

ผู้พัฒนา: SparkAudio · ใบอนุญาต Apache 2.0

ลองดูสิ

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

ผู้พัฒนา: RVC-Boss · ใบอนุญาต MIT

ลองดูสิ

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

ผู้พัฒนา: Canopy Labs · ใบอนุญาต Llama 3.2 Community

ลองดูสิ

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ผู้พัฒนา: Alibaba (Qwen) · ใบอนุญาต Apache 2.0

ลองดูสิ

ChatterboxChatterbox Premium

การโคลนเสียงแบบ Zero-shot ด้วยการควบคุมอารมณ์ จาก Resemble AI

คุณภาพ:

ลองดูสิ

Tortoise TTSTortoise TTS Premium

การแปลงข้อความเป็นเสียงหลายเสียง เน้นคุณภาพด้วยสถาปัตยกรรมอัตโนมัติ

คุณภาพ:

ลองดูสิ

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

คุณภาพ:

ลองดูสิ

OpenVoiceOpenVoice Premium

โคลนเสียงในทันที ด้วยการควบคุมสไตล์ อารมณ์ และสำเนียง

คุณภาพ:

ลองดูสิ

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ภาษา: en, zh, ja, ko, fr, de, it, es

โคลนเสียง

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

ภาษา: en, zh

โคลนเสียง

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

ภาษา: en, zh

โคลนเสียง

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

ภาษา: en, zh, ja, ko

โคลนเสียง

ChatterboxChatterbox

การโคลนเสียงแบบ Zero-shot ด้วยการควบคุมอารมณ์ จาก Resemble AI

ภาษา: en

โคลนเสียง

Tortoise TTSTortoise TTS

การแปลงข้อความเป็นเสียงหลายเสียง เน้นคุณภาพด้วยสถาปัตยกรรมอัตโนมัติ

ภาษา: en

โคลนเสียง

OpenVoiceOpenVoice

โคลนเสียงในทันที ด้วยการควบคุมสไตล์ อารมณ์ และสำเนียง

ภาษา: en, zh, ja, ko, fr, de, es, it

โคลนเสียง

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ภาษา: en, zh, ja, ko, de, fr, ru, pt, es, it

โคลนเสียง

API สำหรับผู้พัฒนา

REST API ที่เข้ากันได้กับ OpenAI จุดสิ้นสุดหนึ่ง โมเดลมากกว่า 22 ตัว สนับสนุนการสตรีมสำหรับแอพพลิเคชันในเวลาจริง

  • รูปแบบที่รองรับ OpenAI
  • การสตรีม TTS สำหรับแอปพลิเคชันเวลาจริง
  • ประมวลผลเป็นกลุ่มสำหรับงานขนาดใหญ่
  • การแจ้งให้ทราบของ Webhook
แสดงเอกสาร API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

ราคาที่เรียบง่ายและโปร่งใส

เริ่มต้นฟรี ปรับขนาดตามที่คุณเติบโต

ว่าง

$0

50 เครดิต

  • Kokoro, Piper, VITS, MeloTTS
  • จำกัดตัวอักษร 500 ตัว
  • 3 gen/ ชั่วโมง (ไม่มีบัญชี)
ลงทะเบียน

เริ่มการทำงาน

$9/ชั่วโมง

500 เครดิต/เดือน

  • ทั้งหมด 22+ รุ่น
  • จำกัดตัวอักษร 5,000 ตัว
  • การคัดลอกเสียง
เริ่มต้น
ยอดนิยมที่สุด

โปร

$29/ชั่วโมง

2,000 เครดิต/เดือน

  • ทุกอย่างใน Starter
  • การเข้าถึง API
  • การประมวลผลความสำคัญ
รับโปรเฟส

เอ็นเตอร์ไพรส์

$99/ชั่วโมง

10,000 เครดิต/เดือน

  • ทุกอย่างในโปร
  • บล๊อก API
  • คิวที่ให้ความสำคัญ
ติดต่อฝ่ายขาย

View all plans including credit packs →

คำถามที่ถามบ่อย

TTS.ai เป็นแพลตฟอร์มเสียงอัจฉริยะที่ครอบคลุมที่สุด นำเสนอแบบจำลองการแปลงข้อความเป็นคำพูด 22+ แบบจำลองการแปลงคำพูดเป็นข้อความ และเครื่องมือเสียง

ใช่! TTS.ai เสนอการแปลงข้อความเป็นคำพูดฟรี ด้วยโมเดล Kokoro, Piper, VITS, และ MeloTTS ไม่จำเป็นต้องมีบัญชี ลงทะเบียนเพื่อรับเครดิตฟรี 50 และเข้าถึงโมเดลทั้งหมด

สำหรับความเร็ว ใช้ Kokoro หรือ Piper สำหรับคุณภาพ ลองใช้ CosyVoice2หรือ StyleTTS 2. สำหรับโคลนเสียง ใช้ Chatterbox หรือ GPT- SoVITS สำหรับโต้ตอบ ใช้ Dia TTS ลองใช้หลายแบบบนข้อความเดียวกันเพื่อเปรียบเทียบ

ใช่ REST API ที่เข้ากันได้กับ OpenAI สำหรับ TTS, STT, โคลนเสียง, และเครื่องมือเสียง มีให้บริการบนแพ็คเกจ Pro ($29/month) และ Enterprise ($99/month) ดูเอกสารที่ tts.ai/api/

คุณภาพเสียงแตกต่างกันไปตามรุ่น รุ่นพิเศษ เช่น CosyVoice 2, StyleTTS 2, และ Chatterbox ผลิตเสียงที่มีคุณภาพใกล้เคียงกับเสียงของมนุษย์ ด้วยระดับเสียงและอารมณ์ตามธรรมชาติ รุ่นฟรี เช่น Kokoro เสนอคุณภาพเสียงที่ยอดเยี่ยมสำหรับกรณีการใช้งานส่วนใหญ่

TTS.ai รองรับภาษามากกว่า 30 ภาษาในไลบรารีโมเดลของมัน ภาษาอังกฤษมีโมเดลที่รองรับมากที่สุด แต่โมเดลเช่น CosyVoice 2 รองรับภาษาจีน ญี่ปุ่น และเกาหลี GPT-SoVITS รองรับภาษาจีน ญี่ปุ่น เกาหลี และอังกฤษ และ MeloTTS รองรับภาษาอังกฤษ สเปน ฝรั่งเศส จีน ญี่ปุ่น และเกาหลี

ใช่ การประมวลผลทั้งหมดจะเกิดขึ้นบนเซิร์ฟเวอร์ GPU ของเรา เราจะไม่เก็บข้อมูลการป้อนข้อความของคุณหรือเสียงที่สร้างขึ้นหลังจากการส่งมอบ ตัวอย่างเสียงที่อัปโหลดเพื่อโคลนจะถูกใช้เฉพาะสำหรับวาระการทำงานปัจจุบันเท่านั้น และจะไม่ถูกเก็บไว้ เราจะไม่เคยแบ่งปันข้อมูลของคุณกับบุคคลที่สาม หรือใช้มันเพื่อฝึกโมเดล

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai สร้างเสียงในรูปแบบ WAV โดยปริยายเพื่อคุณภาพสูงสุด คุณสามารถแปลงเป็น MP3, FLAC, OGG หรือ M4A โดยใช้เครื่องมือแปลงเสียงฟรีของเรา API สนับสนุนการกำหนดรูปแบบผลลัพธ์ที่คุณต้องการโดยตรงในคำร้องขอ

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

โมเดลฟรี (Kokoro, Piper, VITS, MeloTTS) ไม่จำเป็นต้องมีบัญชีและใช้เงินเป็นศูนย์ โมเดลมาตรฐาน (2 เครดิต/ 1K ตัวอักษร) ประกอบด้วย Bark, CosyVoice 2, F5-TTS, และ Dia โมเดลพิเศษ (4 เครดิต/ 1K ตัวอักษร) ประกอบด้วย OpenVoice, Chatterbox, StyleTTS 2, และ Tortoise โมเดลที่มีค่าใช้จ่ายโดยทั่วไปจะให้คุณภาพสูงขึ้น เสียงมากขึ้น และคุณสมบัติเพิ่มเติม เช่น โคลนเสียง

ใช่ API สนับสนุนการประมวลผลแบบบั๊กสำหรับแปลงข้อความเป็นเสียงจำนวนมาก ส่งคำร้องขอหลายครั้ง และรับผลลัพธ์แบบไม่สม่ำเสมอ โดยใช้ UUID ของงาน แพ็คเกจ Enterprise ($99/ เดือน) ประกอบด้วยการเข้าถึงคิวเพื่อประมวลผลแบบบั๊กที่รวดเร็วขึ้น เหมาะสำหรับการผลิตหนังสือเสียง เนื้อหาวิชา และโปรเจกต์เสียงขนาดใหญ่
5.0/5 (1)

เริ่มใช้ AI Voice วันนี้เลย

ร่วมมือกับผู้สร้าง นักพัฒนา และธุรกิจที่ใช้ TTS.ai