Free AI Testun i LeferyddComment

22+ modelau ffynhonnell agored, 100+ llais, 32+ ieithoedd. Nid oes angen cyfrif.

0/500 Nodau Rhydd
Dim cerdyn credyd 50 credyd am ddim 32+ ieithoedd Defnydd masnachol OK
0:00 / 0:00
Lawrlwytho Sain Mae'r cyswllt yn darfod mewn 24 awr
Ydych chi'n hoffi TTS.ai? Dywedwch wrth eich ffrindiau!

Popeth sydd ei angen arnoch ar gyfer AI LleferyddName

26 offer wedi'u pweru gan 24+ modelau AI ffynhonnell agored

22+ Modelau Lleferydd AI

Y casgliad mwyaf eang o fathau TTS ffynhonnell agored ar un platfform

KokoroKokoro Free

Model testun-i-leferydd 82 miliwn o baramedrau yw Kokoro sy'n gwneud yn well na'i ddosbarth pwysau. Er gwaethaf ei faint bach, mae'n cynhyrchu siarad naturiol a chryno. Cynhelir nifer o ieithoedd gan gynnwys Saesneg, Japaneg, Tsieineeg a Corea gydag amrywiaeth o lais cryf. Mae'n rhedeg yn gyflym iawn - yn creu sain bron 100 gwaith yn gyflymach na real-time ar GPU.

Gorau ar gyfer: TTS o ansawdd uchel gyda chynnydd lleiaf, rhaglenni llifogydd

Ceisiwch Am Ddim

PiperPiper Free

Peiriant testun-i-leferydd ysgafn yw Piper a ddatblygwyd gan Rhasspy sy'n defnyddio strwythurau VITS a laryncs. Mae'n rhedeg yn llwyr ar CPU, gan ei wneud yn berffaith ar gyfer dyfeisiau ymylon, awtomeiddio cartref, a rhaglenni sy'n gofyn am TTS all-lein. Gyda dros 100 o lais dros 30+ o ieithoedd, mae Piper yn darparu lleferydd sy'n swnio'n naturiol ar gyflymderau gwirioneddol hyd yn oed ar Raspberry Pi 4.

Gorau ar gyfer: Rhagolygon cyflym, hygyrchedd, a rhaglenni mewnadeiladedig

Ceisiwch Am Ddim

VITSVITS Free

VITS (Dealltwriaeth Amrywiol gyda dysgu gwrthwynebol ar gyfer Testun-i-Leferydd diwedd-i-ddiwedd) yw dull TTS diwedd-i-ddiwedd paralel sy'n creu sain sy'n swnio'n fwy naturiol na'r modelau cyfredol o ddau gam. Mae'n mabwysiadu dealltwriaeth amrywiol wedi'i wella gyda llifoedd normaleiddio a phrosesu hyfforddi gwrthwynebol, gan gyflawni gwelliannau sylweddol mewn naturioldeb.

Gorau ar gyfer: Testun-i-leferydd pwrpas-cyffredinol gyda phrosodi naturiolName

Ceisiwch Am Ddim

MeloTTSMeloTTS Free

Llyfrgell TTS aml-iaith yw MeloTTS gan MyShell.ai sy'n cynnal Saesneg (Americanaidd, Prydeinig, Indiaidd, Awstralaidd), Sbaeneg, Ffrangeg, Tsieineaidd, Japaneaidd a Corea. Mae'n hynod o gyflym, yn prosesu testun ar gyflymder sy'n debyg i gyflymder amser real ar y CPU yn unig. Mae MeloTTS wedi ei ddylunio ar gyfer defnydd cynhyrchu ac yn cynnal dehongliad CPU a GPU.

Gorau ar gyfer: Rhaglenni cynhyrchu sydd angen TTS cyflym, aml-ieithog

Ceisiwch Am Ddim

BarkBark Standard

Model testun-i-sain seiliedig ar drawsnewidydd sy'n creu siarad, cerddoriaeth ac effeithiau sain realistig.

Datblygwr: Suno · Trwydded: MIT

Ceisiwch hi

Bark SmallBark Small Standard

Fersiwn ysgafnach o Bark gyda dehongli cyflymach a defnydd cof is. Name

Datblygwr: Suno · Trwydded: MIT

Ceisiwch hi

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.

Datblygwr: Alibaba (Tongyi Lab) · Trwydded: Apache 2.0

Ceisiwch hi

Dia TTSDia TTS Standard

Model creu ymgom aml-seinydd sy'n creu sgyrsiau naturiol rhwng siaradwyr.

Datblygwr: Nari Labs · Trwydded: Apache 2.0

Ceisiwch hi

Parler TTSParler TTS Standard

Disgrifiwch y llais rydych ei eisiau mewn iaith naturiol a bydd Parler yn creu llais sy'n cydweddu.

Datblygwr: Hugging Face · Trwydded: Apache 2.0

Ceisiwch hi

IndexTTS-2IndexTTS-2 Standard

TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.

Datblygwr: Index Team · Trwydded: Apache 2.0

Ceisiwch hi

Spark TTSSpark TTS Standard

Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.

Datblygwr: SparkAudio · Trwydded: Apache 2.0

Ceisiwch hi

GPT-SoVITSGPT-SoVITS Standard

Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.

Datblygwr: RVC-Boss · Trwydded: MIT

Ceisiwch hi

OrpheusOrpheus Standard

Model TTS emosiynol lefel dynol wedi ei hyfforddi ar 100K o oriau o ddata siarad.

Datblygwr: Canopy Labs · Trwydded: Llama 3.2 Community

Ceisiwch hi

Qwen3 TTSQwen3 TTS Standard

TTS aml-ieithog Alibaba gyda chlonio llais, lleisiau rhagosodedig, a dylunio llais o destun.

Datblygwr: Alibaba (Qwen) · Trwydded: Apache 2.0

Ceisiwch hi

ChatterboxChatterbox Premium

Clonio llais zero-shot o'r radd flaenaf gyda rheoli teimladau o Resemble AI.

Ansawdd:

Ceisiwch hi

Tortoise TTSTortoise TTS Premium

Testun-i-leferydd aml-lais wedi'i ganolbwyntio ar ansawdd gydag adeiladwaith awto-adferol.

Ansawdd:

Ceisiwch hi

StyleTTS 2StyleTTS 2 Premium

Testun-i-ganu ar lefel dynol drwy ddargludiad arddull a hyfforddiant gwrthwynebiad.

Ansawdd:

Ceisiwch hi

OpenVoiceOpenVoice Premium

Clonio llais yn syth gyda rheoli graenus dros arddull, teimlad, a chaneuon.

Ansawdd:

Ceisiwch hi

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.

Ieithoedd: en, zh, ja, ko, fr, de, it, es

Cloi Llythyren

IndexTTS-2IndexTTS-2

TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.

Ieithoedd: en, zh

Cloi Llythyren

Spark TTSSpark TTS

Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.

Ieithoedd: en, zh

Cloi Llythyren

GPT-SoVITSGPT-SoVITS

Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.

Ieithoedd: en, zh, ja, ko

Cloi Llythyren

ChatterboxChatterbox

Clonio llais zero-shot o'r radd flaenaf gyda rheoli teimladau o Resemble AI.

Ieithoedd: en

Cloi Llythyren

Tortoise TTSTortoise TTS

Testun-i-leferydd aml-lais wedi'i ganolbwyntio ar ansawdd gydag adeiladwaith awto-adferol.

Ieithoedd: en

Cloi Llythyren

OpenVoiceOpenVoice

Clonio llais yn syth gyda rheoli graenus dros arddull, teimlad, a chaneuon.

Ieithoedd: en, zh, ja, ko, fr, de, es, it

Cloi Llythyren

Qwen3 TTSQwen3 TTS

TTS aml-ieithog Alibaba gyda chlonio llais, lleisiau rhagosodedig, a dylunio llais o destun.

Ieithoedd: en, zh, ja, ko, de, fr, ru, pt, es, it

Cloi Llythyren

API Datblygwr-Arwain

API REST sy'n gydnaws â OpenAI. Un diwedd-bwynt, 22+ model. Cynhaliaeth llif ar gyfer cymwysiadau amser real.

  • Fformat cydnaws â OpenAI
  • Llif TTS ar gyfer rhaglenni amser real
  • Prosesu batch ar gyfer swyddi mawr
  • Hysbysiadau Webhook
Gweld Dogfennaeth API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Prisio Syml, Tryloyw

Dechreuwch yn rhydd. Graddio wrth i chi dyfu.

Rhydd

$0

50 credyd

  • Kokoro, Piper, VITS, MeloTTS
  • Terfyn 500 nod
  • 3 gen/awr (dim cyfrif)
Cofrestru

Cychwynydd

$9/% 1 mis

500 credyd/mis

  • Pob 22+ model
  • Terfyn 5,000 nod
  • Clonio Llywio
Cychwyn
Poblogaf

Pro

$29/% 1 mis

2,000 credyd/mis

  • Popeth yn y Cychwynydd
  • Cyrchiad API
  • Prosesu blaenoriaeth
Cael Proffesiynol

Enterprise

$99/% 1 mis

10,000 credyd/mis

  • Popeth mewn Pro
  • API Bulk
  • Ciw blaenoriaeth
Cysylltiadau

Gweld pob cynllun gan gynnwys pecynnau credyd →

Cwestiynau a Ofynnir yn Aml

TTS.ai yw'r platfform llais AI mwyaf cwmpasu, yn cynnig 22+ modelau testun-i-ganu, clonio llais, llais-i-testun, ac offer sain. Mae pob model yn ffynhonnell agored heb gloi mewn gwerthwr.

Ie! Mae TTS.ai yn cynnig testun-i-ganu am ddim gyda modelau Kokoro, Piper, VITS, a MeloTTS. Nid oes angen cyfrif. Cofrestru i gael 50 credyd am ddim a mynediad i bob model. Mae cynlluniau talu yn dechrau ar $9/mis.

Ar gyfer cyflymder, defnyddiwch Kokoro neu Piper. Ar gyfer ansawdd, ceisiwch CosyVoice 2 neu StyleTTS 2. Ar gyfer clonio llais, defnyddiwch Chatterbox neu GPT-SoVITS. Ar gyfer cyfathrebu, defnyddiwch Dia TTS. Ceisiwch sawl model ar yr un testun i'w gymharu.

Ydy. API REST sy'n gydnaws â OpenAI ar gyfer TTS, STT, clonio llais, ac offer sain. Ar gael ar gynlluniau Pro ($29/mis) ac Enterprise ($99/mis). Gweler dogfennaeth ar tts.ai/api/.

Mae ansawdd y llais yn amrywio yn ôl y model. Mae modelau premiwm fel CosyVoice 2, StyleTTS 2, a Chatterbox yn cynhyrchu llais o ansawdd sy'n debyg i'r un dynol, gydag arddull naturiol ac emosiynau. Mae modelau am ddim fel Kokoro yn cynnig ansawdd rhagorol ar gyfer y rhan fwyaf o achosion defnydd.

Mae TTS.ai yn cynnal mwy na 30 o ieithoedd drwy ei llyfrgell modelau. Mae gan Saesneg y gynhaliaeth modelau ehangaf, ond mae modelau fel CosyVoice 2 yn cwmpasu Tsieinëeg, Japaneg a Corea; mae GPT-SoVITS yn trin Tsieinëeg, Japaneg, Corea a Saesneg; ac mae MeloTTS yn cynnal Saesneg, Sbaeneg, Ffrangeg, Tsieinëeg, Japaneg a Corea.

Ydy. Mae pob prosesu'n digwydd ar ein gweinyddion GPU arbenigol. Nid ydym yn cadw eich mewnbwn testun na'r sain a gynhyrchir ar ôl ei anfon. Defnyddir samplau llais a lwythwyd i fyny ar gyfer clonio ar gyfer y sesiwn cyfredol yn unig ac nid ydynt yn cael eu cadw. Ni ydym byth yn rhannu eich data â thrydydd partïon na'u defnyddio i hyfforddi modelau.

Ydy. Mae pob sain a gynhyrchir ar TTS.ai yn eich eiddo i'w ddefnyddio'n fasnachol, gan gynnwys ar gyfer fideos YouTube, newyddion, llyfr sain, rhaglenni, hysbysebion, a chynhyrchion. Mae ein modelau yn ffynhonnell agored o dan drwyddedau caniataol (MIT, Apache 2.0). Nid oes angen unrhyw hawlfraint na dynodi.

Mae TTS.ai yn creu sain yn y fformat WAV yn rhagosodedig ar gyfer ansawdd uchaf. Gallwch drosi i MP3, FLAC, OGG, neu M4A gan ddefnyddio ein hidlydd sain am ddim. Mae'r API yn cefnogi penodi eich fformat allbwn hoffus yn uniongyrchol yn y cais.

Lawrlwythwch sampl sain byr (hyd at 5 eiliad) o'r llais yr ydych am ei cloni, ac yna teipiwch unrhyw destun i greu siarad yn y llais hwn. Mae modelau fel Chatterbox, GPT-SoVITS, a CosyVoice 2 yn cynnal cloni llais. Mae'r llais wedi'i cloni yn dal y ton, y geiriau, a'r arddull siarad.

Nid oes angen cyfrif ar y modelau am ddim (Kokoro, Piper, VITS, MeloTTS) ac maent yn costio dim credydau. Mae'r modelau safonol (2 credyd/1K o nodau) yn cynnwys Bark, CosyVoice 2, F5-TTS, a Dia. Mae'r modelau premiwm (4 credyd/1K o nodau) yn cynnwys OpenVoice, Chatterbox, StyleTTS 2, a Tortoise. Mae'r modelau a dalwyd yn aml yn cynnig ansawdd uwch, mwy o lais, a nodweddion ychwanegol fel clonio llais.

Ie. Mae'r API yn cynnal prosesu batch er mwyn trosi niferoedd mawr o destun i lais. Anfonwch nifer o geisiadau ac adferwch ganlyniadau'n anghydnaws gan ddefnyddio UUIDs swyddi. Mae cynlluniau busnes ($99/mis) yn cynnwys cyrchu ciw blaenoriaeth ar gyfer prosesu batch cyflymach. Mae'n ddelfrydol ar gyfer cynhyrchu llyfr sain, cynnwys cwrs, a phrosiectau diddanu ar raddfa fawr.
5.0/5 (1)

Dechrau Defnyddio Lleferydd AI Heddiw

Ymuno â chrewyr, datblygwyr a busnesau sy'n defnyddio TTS.ai