VibeVoice

Speaker 3

Стандарт Англи хэл Neutral VibeVoice

Speaker 3 нь VibeVoice текст- рүү- ярих загвараар ажилладаг neutral хиймэл оюун ухааны дуу. Энэ стандарт түвшин дуу Англи хэл хэлээр ярьдаг ба Студи- чанартай яриа синтезийг өгдөг. ойролцоо үүсгэх хурд болон 5/5 чанарын үнэлгээтэй Speaker 3 нь podcasts, dialogues, long-form narration, multi-speaker content-д тохиромжтой. VibeVoice хөдөлгүүрийг Microsoft under the MIT license боловсруулсан бөгөөд энэ нь худалдааны зориулалтаар ашиглахад аюулгүй. Түүний гол бүтээлүүд нь: "Хүний эрх" (1995).

Үнэлгээ байхгүй

VibeVoiceМодель мэдээ

Модель VibeVoice
Хөгжүүлэгч Microsoft
Чадвар
Хурд Хурдан
Лиценз MIT
Хослох Үгүй
Гуравдугаар Стандарт (2 кредит/ 1K тэмдэгт)
Параметрүүд 1.5B
Архитектур LLM + DAC
Сургалтын мэдээ 100000 цаг
Жил 2025

Хамгийн сайн хэрэглээний тохиолдол Speaker 3

Энэ дууны шинж чанарт үндэслэн зөвлөсөн програмууд

Сонсголын номууд ба яриа

Speaker 3 -ийг урт хэлбэрийн агуулгад байгалийн хэмнэл, илэрхийлэлээр ярихад ашиглана.

Видео дуут дохио

YouTube видео, зар сурталчилгаа, нийгмийн сүлжээний контентоос мэргэжлийн яриаг нэмнэ.

Хэрэгслүүд ба хүрэх боломжууд

Энэ дууг хурдан үүсгэх нь бодит цагны програмууд, дэлгэц унших, хүрэх боломжийн хэрэгслүүд дээр тохиромжтой.

Подкастууд ба дамжуулалт

Подкаст, радио, мэргэжлийн нэвтрүүлэгт тохирсон студи чанартай дууны гарчиг.

Илүү VibeVoice Дуунууд

Ижил TTS загвараас бусад дуунууд

Speaker 1

Англи хэл Neutral

Speaker 1 (Chinese)

Хятад Neutral

Speaker 2

Англи хэл Neutral

Speaker 2 (Chinese)

Хятад Neutral

Speaker 4

Англи хэл Neutral

Заримдаа асуудаг асуултууд

Microsoft-ийн VibeVoice нь хоёр хувилбартай: 1. 5B загвар нь урт хэлбэрийн агуулга (90 минут хүртэл,4гар утас) болон ~200ms-ийн эхний дууны саадтай шууд дамжуулах Realtime 0. 5B загвар юм. 1. 5B хувилбар нь подкаст болон дуут номд сайн тохирдог бөгөөд урт хэсгүүдэд дуут дохио тогтвортой байдаг. Сэтгэгдэл: Microsoft-ийн TTS кодыг хадгалах сангаас устгасан бөгөөд үүсгэсэн дуу нь сонсогдох AI хариуцлагаас чөлөөлөхийг агуулдаг.

VibeVoice нь Microsoft-ийн бүтээсэн бөгөөд MIT (research-only intent) лицензийн дор гаргасан бөгөөд энэ нь үүсгэсэн аудиог худалдааны зорилгоор ашиглахыг зөвшөөрдөг.

VibeVoice 1 хэлийг дэмждэг: Англи.

VibeVoice нь Premium түвшинд байна - 1000 тэмдэгт тутамд4кредит. Та VibeVoice дууг бүрэн дуу үүсгэхээс өмнө үнэгүйгээр урьдчилан харах боломжтой.

VibeVoice нь дунд зэргийн хурдтай үүсгэдэг. Энэ нь текстийн уртаас хамааран хэдэн секунд шаарддаг.

VibeVoice нь TTS.ai дээр 5/5 үнэлгээ авсан. Энэ нь студи зэрэглэлийн, хүний ярьдаг шиг яриаг өгдөг.

Үгүй, VibeVoice нь доторх дуугаралтын тогтсон багцыг ашигладаг. Хөгшрөлтгүй дуугаралтын хувьд CosyVoice 2, GPT- SoVITS, эсвэл Chatterbox-ийг туршаад үзээрэй.

Тийм ээ, VibeVoice нь podcast, аудио ном, олон дуут контентууд, 90 минут хүртэлх олон дуут контентууд, podcast үүсгэх чадвар нь энэ хэрэгцээнд тохиромжтой сонголт юм.

Тийм ээ, VibeVoice нь MIT-ийн лицензтэй (шинжилгээний зориулалттай), энэ нь бизнесийн зорилгоор ашиглахыг зөвшөөрдөг. VibeVoice дуугаралтууд нь видео, подкаст, програм, тоглоом, эсвэл бусад бизнесийн зорилгоор ашиглагдаж болно.

Тийм ээ, TTS.ai-ийн бүх дуунууд нь худалдааны лицензтэй нээлттэй эхийн загвар (MIT, Apache 2. 0) ашигладаг. Үйлчилгээний дууг та видео, подкаст, програм, тоглоом, бусад худалдааны програмд ашиглаж болно.

/api/v1/tts/ руу загварын нэр болон дууны ID-тэй POST хүсэлт илгээнэ үү. Python, JavaScript, Go, cURL-ийн кодын жишээг API-ийн баримт бичгийн хуудаснаас олж болно.

Тийм ээ, энэ хуудсан дээрх тоглох товчийг дарж жишээг сонсоорой. Та мөн "Мэдээлэлийг ярианд" хуудсанд өөрийн бичлэгийг оруулж, ямар ч дуугаар үнэгүй туршиж үзэх боломжтой.

Хийх Speaker 3 Одоо

Ямар ч текстийг бичээд сонс Speaker 3. Үнэгүй.