VoxCPM

Default

Standardowe Angielski Neutral VoxCPM

{nazwa} jest głosem a neutral AI napędzanym przez model VoxCPM tekst-na-speech. Ten {nazwa} głos mówi {język} i dostarcza {jakość}- syntezy jakości mowy. O prędkości generacji {prędkości} i jakości oceny 5/5, {nazwa} jest dobrze dopasowany do {najlepsza_ dla}. VoxCPM silnik rozwija się przez OpenBMB{licence}, co sprawia, że jest bezpieczny do użytku handlowego. Kluczowe możliwości obejmują: {podmioty}. Model VoxCPM obsługuje również klonowanie głosu — wysyłka krótkiej próbki audio, aby utworzyć własny głos, który zachowuje te same cechy jakości.

Brak jeszcze ratingów

VoxCPMInformacje o wzorze

Wzór VoxCPM
Rozwijacz OpenBMB
Jakość
Prędkość Szybko
Licencja Apache 2.0
Klonowanie Obsługiwane
Poziom szczelności Standardowe (2 kredyty/1K znaków)
Parametry 500M
Architektura Continuous Space + Flow Matching
Dane szkoleniowe 1800000 godziny
Rok 2025

Najlepsze przypadki użytkowania Default

Zalecane aplikacje oparte na charakterystyce tego głosu

Audiobooks & Narration

Użyć {nazwy} do wypowiadania zawartości długoformowej naturalną prozodą i wyrażeniem.

Wideo Zdjęcia

Dodaj profesjonalne narracje do YouTube wideo, reklam i treści mediów społecznościowych.

Aplikacje i dostępność

Szybka generacja sprawia, że ten głos jest idealny dla aplikacji w czasie rzeczywistym, czytników ekranu i narzędzi dostępności.

Podcasty i transmisje

Wyjście studiowe nadaje się do podcastów, radia i profesjonalnego nadawania.

Więcej VoxCPM Głosy

Pozostałe głosy z tego samego modelu TTS

Default Chinese

Chiński Neutral

Często zadawane pytania

VoxCPM 1.5 przez OpenBMB jest nowoczesnym modelem TTS, który działa w stałej przestrzeni, a nie w dyskretnych tokenach. Wytwarza wysokie wiarygodności 44.1kHz audio, obsługuje klonowanie głosu zerowego od 3 do 10 sekund i utrzymuje spójność pomiędzy paragrafami. Krzyżowy klonowanie pozwala na stosowanie angielskiego głosu do chińskiego mowy i odwrotnie.

VoxCPM został opracowany przez OpenBMB i jest wydany w ramach licencji Apache 2.0, co pozwala na komercyjne wykorzystanie generowanego audio.

VoxCPM obsługuje 2 języki: angielski, chiński.

VoxCPM znajduje się w standardowym poziomie — 2 kredyty na 1000 znaków. Przed generowaniem pełnego dźwięku można podejrzeć każdy głos VoxCPM za darmo.

VoxCPM ma bardzo szybkią prędkość generacji. Uruchomiona jest w czasie rzeczywistym, dzięki czemu nadaje się do transmisji i interaktywnych aplikacji.

VoxCPM jest określony 5/5 dla jakości audio na TTS.ai. Zapewnia studio-klasisty, ludzkie przemówienie.

Tak, VoxCPM obsługuje klonowanie głosu zerowego. Wyślij 5-30 sekund dźwięku referencyjnego, aby utworzyć własny głos.

Tak, VoxCPM jest specjalnie zalecany dla wysokiej wiarygodności audio, audiobooks, zawartość długiej formy z konsystencją głosu. Jego 44.1khz audio, wolne od żetonizatora, klonowanie krzyżowe sprawia, że jest to doskonały wybór dla tego przypadku użytkowania.

Tak, VoxCPM jest licencjonowany na Apache 2.0, co pozwala na użytek komercyjny. Audio generowane z VoxCPM głosy mogą być używane w filmach, podcastach, aplikacjach, grach i innych projektach komercyjnych.

Tak, wszystkie głosy na TTS.ai używać komercyjne licencjonowanych modeli open-source (MIT, Apache 2.0). Wygenerowany dźwięk jest używany w filmach wideo, podcastach, aplikacjach, grach i innych aplikacjach komercyjnych.

Wyślij prośbę POST do /api/v1/tts / z nazwą modelu i ID głosu. Zobacz naszą stronę dokumentacji API dla przykładów kodu w Python, JavaScript, Go i cURL.

Tak, kliknij przycisk odtwarzania na tej stronie, aby usłyszeć próbkę. Możesz także wpisać własny tekst na stronie Tekst do mowy i wygenerować bezpłatny podgląd z dowolnym głosem.

Spróbuj. Default Natychmiast.

Wpisz dowolny tekst i wysłuchaj go. Default. Bezpłatny do użytku.