Pocket TTS

Fantine

Libre Ingles Female Pocket TTS

Ang "Ikaw" ay isang awiting Filipino na inawit ni Ai Ai delas Alas at inilabas sa kanyang album na Ikaw. Sa isang karaniwang sistemang panukat ng presyon ng dugo, ang presyon ng dugo ay ang presyon ng dugo sa isang yunit ng oras. Ang mga ito ay maaaring maging mga motor na pang-industriya, o mga motor na pang-komersyo. Ang mga pangunahing kakayahan ay kinabibilangan ng: 100m parameters, cpu inference, voice cloning, single-sample cloning, edge-ready. Ang modelong Pocket TTS ay sumusuporta rin sa cloning ng boses — mag-upload ng isang maikling sample ng audio upang lumikha ng isang pasadyang boses na nananatili sa parehong mga katangian ng kalidad.

Walang mga rating pa

Pocket TTSImpormasyon ng Modelo

Modelo Pocket TTS
Developer Kyutai
Kalidad
Bilis Mabilis
Lisensya MIT
Clone Suportado
Mga hayop > Libre (walang mga character na ginagamit)
Parameter 100M
Arkitektura Transformer + Mimi Codec
Data ng pagsasanay 50000 oras
Taon 2025

> Pinakamahusay na gamitin ang mga kaso para sa Fantine

> Inirerekomendang mga application batay sa mga katangian ng boses na ito

> Audiobooks & Paglalarawan

Ang mga ito ay maaaring magpakita ng mga katangian ng natural na seleksiyon at natural na seleksiyon.

Mga Video Voiceover

Magdagdag ng propesyonal na pagsasalaysay sa mga video, ad, at nilalaman sa social media ng YouTube.

> Apps at Aksesibilidad

Ang mabilis na paglikha ay ginagawang perpekto ang boses na ito para sa mga real-time na apps, mga screen reader, at mga tool sa accessibility.

> Custom Brand Voice

> Clone ito boses estilo sa iyong sariling audio upang lumikha ng isang natatanging branded TTS boses.

Higit pa Pocket TTS Mga Tinig

> Iba pang mga boses mula sa parehong modelo TTS

Alba

Ingles Female

Azelma

Ingles Female

Cosette

Ingles Female

Eponine

Ingles Female

Javert

Ingles Male

Jean

Ingles Male

Mga Madalas Itanong

Ang Pocket TTS ni Kyutai (mga tagapaglikha ng Moshi) ay isang compact na 100M parameter na modelo ng text-to-speech na may kakayahang mag-punch ng mas mataas kaysa sa timbang nito. Mahusay itong gumagana sa CPU, sumusuporta sa zero-shot na cloning ng boses mula sa isang solong sample ng audio, at gumagawa ng natural na tunog na pagsasalita.

Ang Pocket TTS ay binuo ng Kyutai at inilabas sa ilalim ng MIT license, na nagpapahintulot sa komersyal na paggamit ng audio na ginawa.

> Pocket TTS sumusuporta sa2wika: Ingles, Pranses.

> Pocket TTS ay sa Libreng antas - libre - walang mga kredito na kinakailangan. Maaari mong i-preview ang anumang Pocket TTS boses para sa libreng bago bumuo ng buong audio.

> Pocket TTS ay napakabilis na henerasyon ng bilis. Ito ay tumatakbo sa malapit na real-time, na ginagawang angkop para sa streaming at interactive na mga application.

> Pocket TTS ay may markang 4/5 para sa kalidad ng audio sa TTS.ai. Ito ay gumagawa ng mataas na kalidad, natural-tunog ng pagsasalita.

> Oo, Pocket TTS sumusuporta sa zero-shot cloning boses. I-upload ang 5-30 segundo ng reference audio upang lumikha ng isang pasadyang boses.

> Oo, Pocket TTS ay partikular na inirerekomenda para sa lightweight deployment, cpu-lamang kapaligiran, mabilis na boses cloning. 100m parameter nito, cpu pagbubukod, boses cloning kakayahan gawin itong isang mahusay na pagpipilian para sa paggamit na ito kaso.

Oo, ang Pocket TTS ay lisensyado sa ilalim ng MIT, na nagpapahintulot sa komersyal na paggamit. Ang audio na nabuo sa pamamagitan ng mga boses ng Pocket TTS ay maaaring magamit sa mga video, podcast, apps, laro, at anumang iba pang komersyal na proyekto.

Oo, lahat ng boses sa TTS.ai ay gumagamit ng mga modelong open-source na may lisensya ng komersyal (MIT, Apache 2.0). Ang audio na nabuo ay iyong gamitin sa mga video, podcast, apps, laro, at anumang iba pang mga komersyal na application.

Ipadala ang isang POST na kahilingan sa /api/v1/tts/ na may pangalan ng modelo at boses ID. Tingnan ang aming API Documentation page para sa mga halimbawa ng code sa Python, JavaScript, Go, at cURL.

> Oo, i-click ang play button sa pahinang ito upang marinig ang isang sample. Maaari mo ring i-type ang custom na teksto sa Text to Speech page at makabuo ng isang libreng preview sa anumang boses.

Subukan Fantine Ngayon

> I-type ang anumang teksto at marinig ito sinabi sa pamamagitan ng Fantine. Libreng gamitin tl> na walang mga character na kinakailangan.