Уншихаас унших

Хэлсэн дууг өөрчлөх - дуу хоолой, сэтгэл хөдлөл, хэл, хэв маягийг өөрчилж, эхний агуулгаа хадгална.

Танай хэл дээр одоогоор TTS дуунууд байхгүй байна. Танай дууг нэмэхэд туслаарай! Таны дуу хоолойг зарна

Аудио эх үүсвэр

Файлуудыг татаж аваад энд буулга, эсвэл Хуудас

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
эсвэл өөрийнхөө дууг бичээрэй.
00:00

Бүтээгдэхүүний тохиргоо

Файлуудыг татаж аваад энд буулга, эсвэл Хуудас

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

Үр дүн

Хөгжүүлэгч

Хэлний хувиргалт... Энэ хэсэг хугацаа шаардах болно.

Эх үүсвэр

Өөрчилсөн

Яаж ажилладаг вэ

1. Хэл яриаг өргөтгө

Өөрчлөхийг хүссэн дууг бичлэгт оруулах эсвэл татаж авах

Бүтээгдэхүүний нэр:

Сонсогчдын дууны өөрчлөлт, хэв маягийн шилжүүлэлт эсвэл хэлний хөрвүүлэлтийг сонгоно уу

3. AI хувиргалтууд

Хөгжмийн агуулгаа хадгалж дууны дууг төгсгөлөөс төгсгөл хүртэл боловсруулдаг

Дэлгэцийг татаж авах

Үр дүнг сонсож, өөрчлөгдсөн дууг татаж аваарай

Ашиглах тохиолдол

Тоглоомын агуулга, хүрэх боломж, бүтээлч төслүүдэд зориулсан ярианаас ярианд

Видео дуураймал

Видеог өөр хэл рүү орчуулахдаа эхний яригчдын дууны онцлогийг хадгална.

Сэтгэл хөдлөлийн тохиргоо

Хөгжмийн бичлэгийн сэтгэл хөдлөлийн өнгө аясыг өөрчлөх - тайван яриаг өдөөж, эсвэл төвөггүй яриаг дулаан, найрсаг болгоно.

Дуу оруулах

Хөгжмийн бичлэгийг өөр өөр дуу, хэв маягаар өнгөлөг дуу болгон хувиргах.

Дууны нууцлал

Хэлэгчийн нэрийг нуун дарагдуулж, үг бүрийг хадгална, нууц мэдээллийг ил болгох, эсвэл хувийн нууцыг хамгаалах зорилгоор.

Хэл ярианы загварууд

OpenVoice

Хэт авианы өнгөний тохиргоотой хурдан дууны хөрвүүлэгч. Хоёр секундэд дууны өнгө, хурд, мэдрэмжийг өөрчлөх.

  • Хурдан боловсруулалт
  • Стиль шилжүүлэх
  • Олон хэлний

Chatterbox

Resemble AI-ийн эерэг сэтгэл хөдлөлийг хянах Zero-shot дууны клон.

  • Сэтгэл хөдлөлийн удирдлага
  • Zero-shot клончлох
  • Өндөр чанартай

CosyVoice 2

Хэл хоорондын дуу хоолойг 8 хэлээр клонлох, байгалийн хэмнэл, дамжуулах дэмжлэг.

  • 8 хэл
  • Хөгжим
  • Шуурхай дамжуулалт

Заримдаа асуудаг асуултууд

Сүүлчийн хувилбар:

"Мэдээлэлээс яриа" нь бичсэн мэдээллийг дуу болгон хувиргаж өгдөг. Мэдээлэлээс яриа нь байгаа мэдээллийг оруулга болгон авч шууд шинэ мэдээллээр солино. Мэдээллийг зөвхөн текстээс гаргаж авахын оронд, эх бичвэрийн ритм, зогсолт, анхаарал, сэтгэл хөдлөлийг хадгална.

Энэ нь видеог өөр хэл рүү орчуулах, бичлэгийн дуу хоолойг өөрчлөх, байгаа аудионы өнгө, өнгө аясыг тохируулах, хуучин бичлэгээс дууны орчуулга хийх, мөн бичлэгийн агуулгаа хадгалж дууны орчуулгыг нууцлах зэрэгт ашиглагддаг.

OpenVoice, RVC зэрэг дууны хөрвүүлэлтийн загварууд дуунаас дуу руу хөрвүүлэлтийг гүйцэтгэдэг. Хэл хоорондын ярианаас ярианд шилжихэд CosyVoice 2, GPT-SoVITS нь өөр хэл дээр клонолж, дахин синтезлэх боломжтой. Chatterbox нь reference-audio based synthesis-ийг дэмждэг.

Тийм ээ. Хөгжимний клон модел ашиглан та өөрийн дууны онцлогийг хадгалж, яриагаа өөр хэл рүү хөрвүүлж болно. Дэлгэцийн дохио таны дууны онцлогийг гаргаж авч, дууг зорилготой хэл эсвэл хэв маягаар дахин синтезлэнэ.

Энэ хоолой нь эхлээд таны яриаг бичлэг болгон, дараа нь текстийг зорилготой хэл рүү орчуулж, дууны клон ашиглан орчуулсан текстийг таны эхний дуугаар синтезлэнэ. CosyVoice 2- ийн загварууд 8 хэлийг хэл хоорондын синтезийг дэмждэг.

Хамгийн сайн үр дүнд хүрэхийн тулд фонын чимээ багатай, цэвэр дууг татаж аваарай. 16 кГц эсвэл түүнээс дээшийн WAV, FLAC форматууд хамгийн тохиромжтой. MP3, OGG, M4A, WEBM форматууд ч мөн хүлээн зөвшөөрөгддөг. Тогтмол яриа нь хамгийн нарийвчлалтай хувиргалт хийдэг.

Кокоро болон Faster Whisper зэрэг хурдан загваруудыг ашиглан бидний API- ээр дамжуулан ойролцоогоор бодит цаг хугацаанд боловсруулж болно. Хоцролт нь загвар болон дууны уртаас хамаарна, гэхдээ богино үгээр 3- аас бага секундын хугацаанд боловсруулж болно.

Тийм ээ. Chatterbox, Spark TTS, IndexTTS- 2 зэрэг загварууд сэтгэл хөдлөлийн болон хэв маягийн удирдлагыг дэмждэг. Та чимээгүй яриаг хөдөлгөж, гунигтай яриаг баярлуулж, эсвэл төвийг сахисан яриаг хүчтэй болгож болно. Гэхдээ үг болон яригчдын ялгааг хадгална.

Хэлнээс ярианд шилжүүлэх нь ойлгох болон синтезийн кредитүүдийг нэгтгэдэг. Жишээ нь, 1 минутын хувиргалт сонгосон загвараас хамааран 3- 8 кредитийг зарцуулдаг. Кокоро гэх мэт үнэгүй түвшний загварууд синтезийн алхамуудад үнэгүй ашиглагддаг.

Үнэгүй хэрэглэгчид 1 минут хүртэлх аудиог боловсруулж болно. Төлбөртэй хэрэглэгчид 10 минут хүртэлх файлуудыг боловсруулж болно. Илүү урт бичлэгийн хувьд аудиог хэсэг болгон хуваах эсвэл урт хязгааргүй багц боловсруулалт хийх API-г ашиглана уу.

Тийм ээ, бүх өргөтгөсөн дууг бидний аюулгүй график процессорын сервер дээр боловсруулж 24 цагийн дотор автоматаар устгадаг. Бид таны дууг хэзээ ч загварыг заахдаа ашигладаггүй. Бүх дамжуулалтууд шифрлэгдсэн холболтоор явагддаг ба серверээс серверт дамжуулалтууд нь баталгаажсан байдаг.
5.0/5 (1)

Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.

Аливаа яриаг хиймэл оюун ухаанаар хувиргах

Өөрийн дуу хоолой, сэтгэл хөдлөл, хэл, хэв маягийг өөрчил. Үнэгүй бүртгүүлж эхлэхэд 15,000 тэмдэгт авна.