TTS дүрсийн дуунууд - Ямар ч дүрсийг үүсгэх

Тоглоом, анимейшн, түүх, агуулгад зориулсан онцгой дүрийн дууг бүтээ. Тогтмол дүрүүдийг бүтээхийн тулд дууны клоныг ашигла, Parler TTS-ийг байгалийн хэлээр илэрхийлэх, эсвэл Bark-ийг инээмсэглэх, сэтгэл хөдлөлийг илэрхийлэх дүрүүдэд ашигла. Нэг платформоос бүхэл бүтэн дүрийн баг бий болго.

Зохиогчийн дуу Өөрийн дүрүүд Дууны дугуй Үг Дуунууд

Одоо оролдох

Кокоро, Пайпер, VITS, МелоTTS-тэй чөлөөт
Таны үүсгэсэн дуу энд гарч ирнэ
Бүтээгдэхүүн
Дэлгэц
TTS.ai-г хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Зохиогчийн дууны онцлог

Дэлгэцийн дууны дууг үүсгэх, удирдах хэрэгслүүд

100+ үсгийн дуунууд

Эрэгтэй, эмэгтэй, залуу, хөгшин, гүн, тод, өнгөлөг гэх мэт онцгой дуу авианы каталог. Бүх дуу авиа нь өөрийн гэсэн онцлог шинж чанар, ярианы хэв маягтай.

Классик дуунууд

Сэм, Брайан, Эрик зэрэг алдартай TTS дуунууд нь орчин үеийн AI-ийн нийцтэй дуунуудын санааг өгсөн. Мэдээллийг яриа болгон хувиргах үйлдлийг тодорхойлсон дуунуудын илэрхийлэлтэй, байгалийн хувилбарууд.

Сэтгэл хөдлөлийн удирдлага

Ямар ч дүрийн дуу хоолойг сэтгэл хөдлөлийг илэрхийлэхэд ашиглана - жаргалтай, гунигтай, ууртай, шивнэх, сэтгэл хөдөлсөн. Тогтвортой эсвэл хүчтэй илэрхийлэхийн тулд дууны хүчийг тохируулна.

Дууны дугуй

Аудио жишээнээс бүрэн шинэ дүрийн дууг бүтээ. Өөрийн дүрийг бүтээхийн тулд 5-30 секундын дууг татаж аваарай.

Өөрийн тэмдэгтүүд

"a gruff old pirate" эсвэл "a cheerful young woman withaBritish accent" гэх мэт өөрт тохирсон дүрсүүдийг энгийн Англиар тайлбарлахын тулд Parler TTS ашиглан тохирох дууг олж аваарай.

Бүх сеансуудыг нэгтгэх

Өөр өөр дууны ID-г ашиглах нь дууны шинж чанарыг өөрчилдөггүй. Таны дүрүүд хэдэн зуун үеийн болон бичлэгийн үйлдлийн явцад адилхан сонсогдоно.

Хамгийн сайн дүрс дууны загварууд

Өөр өөр, илэрхийлэх чадвартай дүрийн дууны загварууд

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Хамгийн тохиромжтой: Хамгийн том дууны каталог, илэрхийлэлтэй, байгалийн дуунууд

Хийх Kokoro

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Хамгийн тохиромжтой: Сэтгэл хөдлөл, инээмсэглэл, дууны эффект бүхий 100+ дуугаргагч

Хийх Bark

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 Хөгжүүлэгч

Хамгийн тохиромжтой: Ямар ч дүрийн дууг эерэг сэтгэл хөдлөлийг хянах аргаар дуурайлгах

Хийх Chatterbox

Dia TTSDia TTS

Standard

Multi-speaker dialog generation model that creates natural conversations between speakers.

Medium 5/5

Хамгийн тохиромжтой: Хоёр тэмдэгтийн яриа нь хоёр тэмдэгтийн хоорондын яриаг дэмждэг

Хийх Dia TTS

Parler TTSParler TTS

Standard

Describe the voice you want in natural language and Parler generates matching speech.

Medium 4/5

Хамгийн тохиромжтой: Ямар ч дүрсийг үг болгон бичиж тохирох яриаг үүсгэх

Хийх Parler TTS

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

Хамгийн тохиромжтой: Хүний түвшний сэтгэл хөдлөлийн хүрээг дүрийн дүрслэлд ашиглах

Хийх Orpheus

Хувийн дууг хэрхэн үүсгэх вэ

Ямар ч дүрд зориулсан онцгой дуу авиаг бүтээх

1

Бүх дууны өнгө

100+ дүрийн дууны каталогийг судлаарай. Бүх дууг сонгохоос өмнө өөрийн онцлог, өнгө, өнгөний ялгаа, ярианы хэв маягийг сонсох зорилгоор урьдчилан үзээрэй.

2

Нүүр хуудас

Ямар ч дууны дээжийг сонсохын тулд урьдчилан харах товчийг дарна уу. Хүйс, нас, аялга, зан чанарын дагуу шүүнэ үү. Таны дүрд тохирох дууг олж авна.

3

Сонсголыг үүсгэх

Тоглоомын дүрийн яриаг оруулж, дууг сонгож, үүсгэнэ үү. Сэтгэл хөдлөл илэрхийлэхийн тулд илэрхийллийн тэмдгийг нэмнэ үү. Өөрийн дууны ID-г ашиглан нэгдмэл байдлыг хангана.

4

Дэлгэцийг татаж авах

Төслийнхээ дууг татаж авах. Ямар ч дуу байхгүй бол дээжээс нь клон хийж эсвэл Parler TTS-ээр бичүүл.

Тодорхойлолтууд

Бүх дууны сангуудаар хайлт хий

Сонсогч

Хөгжим, дууны зохиолч

Тоглоомын NPC

Фантази дайчид, шинжлэх ухааны зохиолын удирдагчид, таунхаусны үйлчлэгч, нууцлаг мэргэд. Интерактив тоглоомын яриа болон эрэл хайгуулын ярианууд.

Анимаци

Мульт дүрсүүд, анимэ дуунууд, хэтэрхий их дүрслэлүүд. Амьдралд ойр, илэрхийлэл бүхий дуунууд, тайлбар видеонууд. Name

Профессионал

Корпорацийн төлөөлөгчид, хэрэглэгчдийн үйлчилгээний агентууд, виртуал туслахууд. Бизнес болон бүтээгдэхүүний туршлагад зориулсан цэвэрхэн, найрсаг дуу хоолой. Name

Хэрэгслийн удирдлага

Өөрийн гэсэн дүрийн дууг бүтээх3арга

Нэвтрэх нэр:

100+ загваруудаас урьдчилан бүтээсэн дуу хоолойг хайж үзээрэй. Бүх дуу хоолой нь өөр өөрийн онцлог шинж чанартай - тод, хүчирхэг, гүн, хүчирхэг, хүчирхэг, хүчирхэг, хүчирхэг, хүчирхэг, хүчирхэг, хүчирхэг.

  • 100+ ашиглахад бэлэн дүрсний дуунууд
  • Нас, хүйс, хэв маягаар шүүх
  • Бүтгэхээс өмнөх урьдчилсан үзлэг
  • Бүх үе шатанд тогтвортой чанар

Хөгжүүлэгч

Ямар ч дууг клонлохын тулд 10 секундын дууны жишээг буулгаж эсвэл бичээрэй. Дуучин, өөрийн дуу, эсвэл нийтийн эзэмшлийн бичлэгээс дүрийн дууг бүтээнэ. Клонлагдсан дуу нь ярианы хязгааргүй мөрөнд өөрийн онцлог шинж чанарыг хадгална.

  • 10 секундын аудиог л дуурайлгах
  • Тоон, өнгө, ярианы хэв маягийг хадгална
  • Хязгааргүй олон үеийн хооронд тогтвортой
  • Модель: CosyVoice2, OpenVoice, Fish Speech

Тоглоомын дуунууд (Parler) Name

Таны хүссэн дууг энгийн Англиар тодорхойл: \

  • Ямар ч дууг байгалийн хэлээрээ тайлбарла
  • Тодорхойлолтуудын төгс бус хувилбарууд
  • Нас, хүйс, аялга, дууны өнгө зэргийг хянах
  • Хугацаа алдагдуулахгүй байх

API- ээр дүрс үүсгэх

Бүх дүрсийг олон дүрийн дуугаар бичих

Python — Олон дүрстэй дүрс REST API
import requests

API_KEY = "YOUR_API_KEY"
HEADERS = {"Authorization": f"Bearer {API_KEY}",
           "Content-Type": "application/json"}

# Define character voices
characters = {
    "narrator": {"model": "tortoise", "voice": "train_kennard"},
    "hero":     {"model": "kokoro", "voice": "am_michael"},
    "villain":  {"model": "bark", "voice": "v2/en_speaker_6"},
}

# Script the scene
script = [
    ("narrator", "The two rivals stood face to face in the arena."),
    ("hero", "I've been waiting for this moment."),
    ("villain", "You should have stayed in hiding, fool!"),
    ("narrator", "And with that, the battle began."),
]

for i, (character, line) in enumerate(script):
    cfg = characters[character]
    resp = requests.post("https://api.tts.ai/v1/tts", json={
        "text": line, **cfg, "format": "wav"
    }, headers=HEADERS)
    with open(f"scene_{i:02d}_{character}.wav", "wb") as f:
        f.write(resp.content)

Бүх тэмдэгт, бүх нөөц

Прототип хийхэд зориулсан үнэгүй дуунууд, үйлдвэрлэлд зориулсан үнэтэй дуунууд болон клонууд.

Чөлөөт түвшин

$0

15000 тэмдэгт

  • Бүтээгдэхүүний дуунууд
  • 4 үнэгүй загвар
  • Бүх тэмдэгтүүдийг шалгах

Эхлүүлэгч

$9

500,000 тэмдэгт/сар

  • Дууны дугуй
  • Бүх 20+ загвар
  • Parler-ийн текстээр тодорхойлсон дуунууд

Про

$29

2,000,000 тэмдэгт/сар

  • Хязгааргүй тооны дуунууд
  • Эмоци
  • Бүтээгдэхүүний цонх
Бүх үнийг харах

Заримдаа асуудаг асуултууд

TTS дүрсүүдийн дууны талаархи түгээмэл асуултууд

TTS.ai нь 100+ дүрийн дууг өөр өөр хүйс, нас, хэлний онцлог, зан чанартай хүмүүст зориулан санал болгодог. Түүний дуунууд нь гүн гүнзгий, үүрэг хариуцлагатай яригчаас эхлээд, эелдэг, хөөрхөн зочин, түүхч, залуу мэргэжилтнүүд хүртэлх бүх төрлийн хүмүүст тохиромжтой. Бүх загварууд өөрсдийн гэсэн онцлог дуу хоолойг санал болгодог.

Бидний хиймэл оюун ухааны загварууд нь хуучин TTS дуу хоолойн загваруудаас санаа авч, нийцтэй дуугардаг. Шинэ үеийн нейрон дуу хоолой нь үүнтэй төстэй шинж чанаруудыг илүү нарийн, тодорхойгоор илэрхийлдэг.

Гурван сонголт: 5-30 секундын аудио дээжээс Chatterbox эсвэл GPT-SoVITS ашиглан дууг клонлох, Parler TTS ("өмнөд өнгө аястай халуун ахмад эрэгтэй") ашиглан дууг энгийн Англиар тайлбарлах, эсвэл 100+ дууг хайж ойролцоо дууг олох.

Тийм ээ. Orpheus, Chatterbox, Bark зэрэг загварууд сэтгэл хөдлөлийн илэрхийлэлд дэмжлэг үзүүлдэг. Өөр өөр сэтгэл хөдлөл - баяртай, гунигтай, ууртай, шивнэх, урам зоригтой - - - - - - - - - - - - - - - - - -

Тийм. Нэг дууны ID, загварыг ашигласнаар бүх үеийн дууны шинж чанарыг нэгтгэх боломжтой. Таны дүр 10 эсвэл 10,000 мөр үүсгэсэн ч гэсэн дуу нь ижил байх бөгөөд энэ нь бүх төслүүдэд нэгдмэл байдлыг хангана.

Тийм ээ. Dia TTS- ийг ашиглана. Энэ нь олон дуут ярианд зориулагдсан. Хоёр дуут ярианы хооронд тохиромжтой эргэлт, завсарлага, сэтгэл хөдлөлийн хариу үйлдлүүдийг үүсгэдэг. Хоёроос илүү дуут яриа бол, эдгээрийг тус тусдаа үүсгэнэ.

Орчин үеийн TTS нь урьдчилан бичсэн ярианы хэсгүүдийг холбож, роботын гаралт гаргадаг. Нейроны загварууд нь ердөөсөө эхлэн яриаг байгалийн хэмнэл, амьсгал, хэмнэлээр үүсгэдэг. Үгүүдийг компьютер уншиж байгаагаас илүүтэй бодит хүн шиг сонсогдоно.

Үнэн. Аудио номынхоо дүрүүдэд өөр өөр дууг заа. Тодорхойлолтуудад яригчдын дууг, ярианд онцгой дүрийн дууг ашигла. Бүх үе шатанд нэг хэвийн байх нь 1- ээс 50- р бүлэг хүртэлх дүрүүдийн дуу нэг хэвийн байхыг хэлнэ.

Хязгаарлалт байхгүй. Төсөл хэрэгцээнд тохирсон олон дуу хоолойг ашигла. Бүх дуу хоолойг өөр өөр загвараас гаргаж авах боломжтой тул өөр өөр загвараас сонгон сонгож болно. Олон дуут номын зохиогчид нэг төсөлд 10- 20 дуу хоолойг ашигладаг.

Тийм ээ. Хөгжим хайгч нь бүх дууны урьдчилсан жишээг харуулна. Төслийн дууг сонгохоос өмнө дууны өнгө, өнгөний ялгаа, зан чанарыг үнэлэхийн тулд богино бичлэгүүдийг сонсоорой. Нүдний шилжилтийг үнэгүй, хязгааргүй сонсох боломжтой.

Хэлний сонголтууд хэл бүрт өөр өөр байдаг. Англи хэл хамгийн олон сонголттой (100+ дуу хоолой). Хятад, Япон, Солонгос, Европын гол хэлнүүд нь олон сонголттой байдаг. CosyVoice 2- ийн хэл хоорондын хослол нь ямар ч дуу хоолойг 8 хэл рүү өргөжүүлдэг.

Энэ дуунууд нь нээлттэй эхийн загваруудаас гаралтай тул тусгай зөвшөөрөлгүй байдаг. Гэхдээ өөрийн дуунаас бүтээсэн өөрийнх нь дуунууд таны дансанд л хамаарна. Өөрийнх нь дууг өөрийн дуучин эсвэл дууны найруулагчаар хийлгээрэй.
5.0/5 (1)

Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.

Өөрийн дүрийг бүтээ

100+ урьдчилан бүтээсэн дуунууд, дууны клон, текстээр тодорхойлсон дуунууд. Ямар ч төслийн онцгой дүрсүүдийг бүтээ.