ტექსტიდან საუბრის API პროგრამისტებისთვისName

შექმენით ხმაზე დაფუძნებული პროგრამები ჩვენი REST API- ით. დაამატეთ ბუნებრივი ტექსტიდან საუბარი, საუბრის კლონირება, საუბრიდან ტექსტი და აუდიოს დამუშავება თქვენს პროგრამებს, ჩეთბოტებს, საუბრის ასისტენტებს და SaaS პროდუქტებს. OpenAI- სთან თავსებადი ფორმატი, 20+ მოდელი, მარტივი ინტეგრაცია.

REST API საუბრის ბოტებიName ხმის პროგრამებიName პროდუქტებიName ავტომატიზაცია

გამოსცადე ახლა

თავისუფალი Kokoro, Piper, VITS, MeloTTS- ით
თქვენი შექმნილი აუდიო აქ გამოჩნდება
შექმნილია
ჩამოტვირთვა
ჟაკაქ TTS.ai? კაზთ თმ ნა ოპთ£არვლთრვ ჟთ!

პროგრამისტების API ფუნქციებიName

ყველაფერი რაც გჭირდებათ ხმაზე დაფუძნებული პროგრამების შესაქმნელადName

მარტივი REST APIName

ერთი POST მოთხოვნა საუბრის შესაქმნელად. JSON მოთხოვნა, აუდიო პასუხი. მუშაობს ნებისმიერი პროგრამირების ენასთან, რომელიც მხარს უჭერს HTTP- ს.

OpenAI- თან თავსებადი

OpenAI TTS API-ს ჩაშენებული შემცვლელი. შეცვალეთ თქვენი base_url და API გასაღები - არსებული კოდი დაუყოვნებლივ იმუშავებს.

ხელმისაწვდომი მოდელები

ყველა მოდელის წვდომა ერთი API- ს საშუალებით. მოდელის შეცვლა ერთი პარამეტრის შეცვლით. ხარისხის, სიჩქარის და ფასის შედარება.

ქვემეორე დაგვიანება

Kokoro აგენერირებს აუდიოს 1 წამზე ნაკლებ დროში. შესანიშნავია რეალურ დროში ჩატის, ხმის ასისტენტებისა და ინტერაქტიული პროგრამებისთვის. Name

ხმოვანი კლონირების APIName

ნებისმიერი ხმა მცირე აუდიოსამსახურის საშუალებით API- ს გამოყენებით. გამოიყენეთ კლონირებული ხმა ყველა მომდევნო თაობაში.

მრავალფეროვანი ფორმატი

გამონატანი WAV, MP3, OGG ან FLAC ფორმატში. დისპლეის სიხშირე და ბიტების სიღრმე აირჩიეთ. რეალურ დროში აუდიოს გადაცემის მხარდაჭერა პროგრამებისთვის.

პროგრამისტების ინტეგრაციის საუკეთესო მოდელიName

სწორი მოდელის არჩევა თქვენი პროგრამის სიჩქარისთვის, ხარისხისთვის და ხარჯების მოთხოვნებისათვისName

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

საუკეთესო: ყველაზე სწრაფი მოდელი - წამზე ნაკლები დაგვიანებით, რეალურ დროში პროგრამებისა და ჩეთბოტებისთვის იდეალური

ოპჲბა£რვ. Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ხმის კლონირებაName

საუკეთესო: TTS-ის გადაცემა ხმის კლონირებასთან ერთად ხმის ასისტენტის პროგრამებისთვის

ოპჲბა£რვ. CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

საუკეთესო: ჩეთბოტისა და ასისტენტის ხმათა ბუნებრივი დროით საუბრის AI

ოპჲბა£რვ. Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

საუკეთესო: უფასო, მხოლოდ CPU მოდელები დიდი მოცულობის პროგრამებისთვის ნულოვანი კრედიტის ღირებულებით

ოპჲბა£რვ. Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

საუკეთესო: აუდიოს შექმნა ხმაურიანი ეფექტებით კრეატიულ და გასართობი პროგრამებისთვის

ოპჲბა£რვ. Bark

TTS API- ს ინტეგრირებაName

რეგისტრაციისგან პირველი API-ს გამოძახებამდე 5 წუთის განმავლობაში

1

API კოდის მიღება

დარეგისტრირდით უფასოდ და შექმნეთ API კოდი თქვენს ანგარიშზე. 50 კრედიტი შედის.

2

პირველი ზარის გაგზავნა

POST /v1/tts-ში ტექსტით, მოდელითა და ხმით. აუდიო ბაიტების დაბრუნება. კოდის 5 ხაზის ქვეშ.

3

მოდელის არჩევა

ტესტირება სხვადასხვა მოდელები თქვენი გამოყენების შემთხვევაში. შედარება სიჩქარე, ხარისხი და ღირებულება ერთი თაობის.

4

პროდუქციაში გადატანა

ფასიანი გეგმების შემთხვევაში ფასის შეზღუდვა არ არსებობს. მონიტორინგი თქვენი ვებ-გვერდის გამოყენების შესახებ.

კოდის სწრაფი დაწყების მაგალითები

TTS.ai-ის ინტეგრირება ნებისმიერ ენაზე ჩვენი REST API- ით

Python პოპულარული
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL უნივერსალური
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- სთან თავსებადი ფორმატი ოპვჟრანთ.
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

რასაც პროგრამისტები TTS.ai-ით ქმნიან

მოდული

AI ჩატი და ასისტენტებიName

საუბრის მოდულის ან AI ასისტენტის ხმაურიანი გამონატანის დამატება. LLM პასუხების გადაცემა TTS- ის საშუალებით საუბრის მხარდაჭერით. Kokoro- ს რეალურ დროში საუბრის დროს ლოკალური ლოდინი არ სჭირდება. Sesame CSM- ს საუბრის ხმაურიანი გამონატანი აქვს ბუნებრივი დროის მართვით.

  • LLM პასუხი საუბრის კონვეიერზეName
  • კოკორო
  • Sesame CSM- ით საუბარიName
  • აუდიო გამონატანი

მობილური და ხმის პროგრამებიName

შექმენით ხმაზე მომუშავე მობილური პროგრამები, ხელმისაწვდომობის ინსტრუმენტები, კითხვის პროგრამები და ენის სწავლის პლატფორმები. ჩვენი REST API მუშაობს ნებისმიერ მობილურ ფრეიმვერთან. ჩამოტვირთეთ აუდიო ფაილები ან პირდაპირ კლიენტში გადმოაგზავნეთ.

  • React Native, Flutter, Swift, KotlinName
  • დამხმარე და კითხვის პროგრამებიName
  • ენათა სწავლების პლატფორმებიName
  • აუდიო შინაარსის შექმნა

პროდუქტებიName

თქვენი SaaS პროდუქტის ხმოვანი შესაძლებლობები. დაამატეთ TTS, STT, ხმოვანი კლონირება და აუდიოს დამუშავება როგორც ფუნქციები თქვენს პლატფორმაში. გამოიყენეთ ჩვენი API როგორც თქვენი ხმოვანი უკან, GPU ინფრასტრუქტურის მართვის გარეშე.

  • White- label ხმის ფუნქციები
  • GPU- ს ინფრასტრუქტურა არ არის საჭირო
  • გამოყენების მიხედვით გადახდა
  • 20+ მოდელი თქვენი მომხმარებლებისთვის

ავტომატიზაციის კონვეინერები

ხმათა გენერაციის ინტეგრირება CI/CD-ს ქსელში, შინაარსის ავტომატიზაცია და პაკეტების დამუშავება. ათასობით აუდიო ფაილის გენერირება ელექტრონული ცხრილების მონაცემებიდან, ვიდეო ჩანაწერების ავტომატიზაცია ან შინაარსის ლოკალიზაციის ქსელის შექმნა.

  • პაკეტის დამუშავება API- ით
  • შინაარსის ლოკალიზაციის ნაკადებიName
  • CI/CD ინტეგრაცია
  • აუდიოს ავტომატიზაციის ელფოსტა

API- ს სპეციფიკაციები

პროდუქციული პროგრამებისთვის შექმნილიName

20+

TTS მოდელი

100+

ხმებიName

30+

ენაName

<1s

დაგვიანება (Kokoro)

ხშირად დასმული კითხვები

TTS.ai-ის პროგრამისტების API- ს შესახებ გავრცელებული კითხვები

დიახ. ჩვენი API ემყარება OpenAI- ს აუდიო საუბრის ფორმატს. თუ თქვენ იყენებთ OpenAI Python- ს ან JavaScript- ის კლიენტის ბიბლიოთეკას, შეგიძლიათ გადახვიდეთ TTS.ai- ზე base_ url და api_ key პარამეტრების შეცვლით. თქვენი არსებული კოდი მუშაობს ცვლილებების გარეშე.

Kokoro 1 წამზე ნაკლებ დროში ქმნის აუდიოს ტიპიური ფრაზებისთვის. CosyVoice 2 მხარს უჭერს სტრიმინგ გამონატანს, რათა დაფიქსირდეს უფრო დაბალი დაგვიანება. ჩეთბოტებისა და ხმის ასისტენტებისთვის, გზაჯვარედინის დრო 1-3 წამს შეადგენს, რაც დამოკიდებულია ტექსტის სიგრძეზე და მოდელზე.

უფასო მოდელი (Kokoro, Piper, VITS, MeloTTS) ღირს 0 კრედიტი. სტანდარტული მოდელი ღირს 2 კრედიტი 1000 სიმბოლოზე. პრემიუმ მოდელი ღირს 4 კრედიტი 1000 სიმბოლოზე. რეგისტრაცია უფასოა 15 კრედიტით. გეგმები იწყება $9/თვეში 500 კრედიტისთვის.

დიახ. ატვირთეთ რეფერენციული აუდიო ნიმუში (5-30 წამი) ხმის კლონირების დასასრული პუნქტში, შემდეგ კი გამოიყენეთ კლონირებული ხმის ID მომდევნო TTS მოთხოვნებში. მოდელები, რომლებიც მხარს უჭერენ კლონირებას: CosyVoice 2, Chatterbox, Fish Speech და GPT-SoVITS.

უფასო დონეზე ძირითადი სიჩქარის შეზღუდვაა (3 მოთხოვნა საათში ანგარიშის გარეშე). გადახდილი გეგმების სიჩქარის შეზღუდვა უფრო ფართოა და პროდუქციული პროგრამებისთვისაა განკუთვნილი. კომპანიის დონის სიჩქარის მოთხოვნების შესახებ დაგვიკავშირდით.

WAV (დასუსტებული, უმაღლესი ხარისხი), MP3 (დასუსტებული, მცირე ფაილები), OGG (ღია ფორმატი) და FLAC (დასუსტებული, მცირე ფაილები). მიუთითეთ ფორმატის პარამეტრები თქვენს მოთხოვნაში. ნაგულისხმევი ფორმატია WAV მოდელის ინდივიდუალური დისკეტაციის სიხშირით.

დიახ. ჩვენი TTS API- ს კომბინირება საუბრის ტექსტად გადამუშავების მოდელთან და LLM- სთან, სრული ხმაურიანი ასისტენტის შესაქმნელად. Kokoro- ს სთავაზობს მცირე წამიანი ლოდინის შესაძლებლობას, რაც რეალურ დროში საუბრისთვის იდეალურია. CosyVoice 2 მხარს უჭერს ვიდეო გამონატანს, რათა პასუხის გაცემის დრო კიდევ უფრო ნაკლები იყოს.

CosyVoice 2 და Kokoro მხარს უჭერენ აუდიოს გადმოცემას, სადაც აუდიოს ნაწილები გადმოცემულია მათი შექმნის დროს. ეს ამცირებს რეალურ დროში პროგრამების, როგორიცაა ხმაურიანი ასისტენტები და ინტერაქტიული გამოცდილება, პირველი ბაიტის მიღების დროს.

API- ს უკან ბრუნავს სტანდარტული HTTP სტატუსის კოდები. 5xx შეცდომის და სიჩქარის საზღვრის პასუხების შემთხვევაში გამოიყენეთ ექსპონენტური უკან დაბრუნება. მნიშვნელოვანი პროგრამებისთვის დაამატეთ ლოდინი და კიდევ ერთხელ სცადეთ. ჩვენი API- ს აქვს მაღალი მუშაობის დრო, მაგრამ ყოველთვის რეკომენდებულია შეცდომის მართვა.

დიახ. /v1/voices და /v1/models საბოლოო წერტილები იძლევა ყველა ხელმისაწვდომი ხმის და მოდელის JSON სიას მათი მეტა მონაცემებით (ენათა მხარდაჭერა, ხარისხის რეიტინგი, სიჩქარის რეიტინგი და ფასების დონე). გამოიყენეთ ისინი თქვენი პროგრამის დინამიური მოდელის არჩევის შესაქმნელად.

თავისუფალი მოდელები (Kokoro, Piper, VITS, MeloTTS) ეფექტური საცურაო აუზის როლს ასრულებენ, რადგან მათი ღირებულება ნულ კრედიტს შეადგენს. შეამოწმეთ თქვენი ინტეგრაცია თავისუფალ მოდელებთან, შემდეგ გადადით პროდუქტიულ პრემიუმ მოდელებზე მოდელის პარამეტრების შეცვლით. დამოუკიდებელი ტესტირების გარემო არ არის საჭირო.

ჩვენი მოდელის უმეტესობა ღია კოდისაა და შეიძლება თვით- ჰოსტინგი. თუმცა, თვით- ჰოსტინგი მოითხოვს მნიშვნელოვან GPU რესურსებს (ჩვენ ვიყენებთ 4x NVIDIA Tesla P40- ს 96GB VRAM- ით). API უზრუნველყოფს ფასდაკლების ალტერნატივას ინფრასტრუქტურის მართვის გარეშე.
5.0/5 (1)

ჲბპარნარა ჟთ ჲბაგვჟრ ნთ ოჲმადა ეა ჟოპაგთმ ოპჲბლვმთრვ.

დჲრჲგ ლთ ჟთ ეა ჟთ ჟრჲპთქ ჟთ დლაჟჲგთწ თნრვლვკრსალვნ ჟთჟრვმა?

მიიღეთ უფასო API ღილაკი და დაიწყეთ მშენებლობა. 50 კრედიტი რეგისტრაციისას, უფასო მოდელები, სრული დოკუმენტაცია.