ტექსტიდან საუბრის API პროგრამისტებისთვისName

შექმენით ხმაზე დაფუძნებული პროგრამები ჩვენი REST API- ით. დაამატეთ ბუნებრივი ტექსტიდან საუბარი, საუბრის კლონირება, საუბრიდან ტექსტი და აუდიოს დამუშავება თქვენს პროგრამებს, ჩეთბოტებს, საუბრის ასისტენტებს და SaaS პროდუქტებს. OpenAI- სთან თავსებადი ფორმატი, 20+ მოდელი, მარტივი ინტეგრაცია.

REST API საუბრის ბოტებიName ხმის პროგრამებიName პროდუქტებიName ავტომატიზაცია

სრული TTS რედაქტორი დოკუმენტაცია

გამოსცადე ახლა

0/500

თავისუფალი Kokoro, Piper, VITS, MeloTTS- ით

თქვენი შექმნილი აუდიო აქ გამოჩნდება

სრული TTS რედაქტორი

პროგრამისტების API ფუნქციებიName

ყველაფერი რაც გჭირდებათ ხმაზე დაფუძნებული პროგრამების შესაქმნელადName

მარტივი REST APIName

ერთი POST მოთხოვნა საუბრის შესაქმნელად. JSON მოთხოვნა, აუდიო პასუხი. მუშაობს ნებისმიერი პროგრამირების ენასთან, რომელიც მხარს უჭერს HTTP- ს.

OpenAI- თან თავსებადი

OpenAI TTS API-ს ჩაშენებული შემცვლელი. შეცვალეთ თქვენი base_url და API გასაღები - არსებული კოდი დაუყოვნებლივ იმუშავებს.

ხელმისაწვდომი მოდელები

ყველა მოდელის წვდომა ერთი API- ს საშუალებით. მოდელის შეცვლა ერთი პარამეტრის შეცვლით. ხარისხის, სიჩქარის და ფასის შედარება.

ქვემეორე დაგვიანება

Kokoro აგენერირებს აუდიოს 1 წამზე ნაკლებ დროში. შესანიშნავია რეალურ დროში ჩატის, ხმის ასისტენტებისა და ინტერაქტიული პროგრამებისთვის. Name

ხმოვანი კლონირების APIName

ნებისმიერი ხმა მცირე აუდიოსამსახურის საშუალებით API- ს გამოყენებით. გამოიყენეთ კლონირებული ხმა ყველა მომდევნო თაობაში.

მრავალფეროვანი ფორმატი

გამონატანი WAV, MP3, OGG ან FLAC ფორმატში. დისპლეის სიხშირე და ბიტების სიღრმე აირჩიეთ. რეალურ დროში აუდიოს გადაცემის მხარდაჭერა პროგრამებისთვის.

პროგრამისტების ინტეგრაციის საუკეთესო მოდელიName

სწორი მოდელის არჩევა თქვენი პროგრამის სიჩქარისთვის, ხარისხისთვის და ხარჯების მოთხოვნებისათვისName

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

საუკეთესო: ყველაზე სწრაფი მოდელი - წამზე ნაკლები დაგვიანებით, რეალურ დროში პროგრამებისა და ჩეთბოტებისთვის იდეალური

ოპჲბა£რვ. Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ხმის კლონირებაName

საუკეთესო: TTS-ის გადაცემა ხმის კლონირებასთან ერთად ხმის ასისტენტის პროგრამებისთვის

ოპჲბა£რვ. CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

საუკეთესო: ჩეთბოტისა და ასისტენტის ხმათა ბუნებრივი დროით საუბრის AI

ოპჲბა£რვ. Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

საუკეთესო: უფასო, მხოლოდ CPU მოდელები დიდი მოცულობის პროგრამებისთვის ნულოვანი კრედიტის ღირებულებით

ოპჲბა£რვ. Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

საუკეთესო: აუდიოს შექმნა ხმაურიანი ეფექტებით კრეატიულ და გასართობი პროგრამებისთვის

ოპჲბა£რვ. Bark

TTS API- ს ინტეგრირებაName

რეგისტრაციისგან პირველი API-ს გამოძახებამდე 5 წუთის განმავლობაში

API კოდის მიღება

დარეგისტრირდით უფასოდ და შექმნეთ API კოდი თქვენს ანგარიშზე. 50 კრედიტი შედის.

პირველი ზარის გაგზავნა

POST /v1/tts-ში ტექსტით, მოდელითა და ხმით. აუდიო ბაიტების დაბრუნება. კოდის 5 ხაზის ქვეშ.

მოდელის არჩევა

ტესტირება სხვადასხვა მოდელები თქვენი გამოყენების შემთხვევაში. შედარება სიჩქარე, ხარისხი და ღირებულება ერთი თაობის.

პროდუქციაში გადატანა

ფასიანი გეგმების შემთხვევაში ფასის შეზღუდვა არ არსებობს. მონიტორინგი თქვენი ვებ-გვერდის გამოყენების შესახებ.

კოდის სწრაფი დაწყების მაგალითები

TTS.ai-ის ინტეგრირება ნებისმიერ ენაზე ჩვენი REST API- ით

Python პოპულარული

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL უნივერსალური

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- სთან თავსებადი ფორმატი ოპვჟრანთ.

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

მიიღეთ თქვენი უფასო API კოდი

რასაც პროგრამისტები TTS.ai-ით ქმნიან

მოდული

AI ჩატი და ასისტენტებიName

საუბრის მოდულის ან AI ასისტენტის ხმაურიანი გამონატანის დამატება. LLM პასუხების გადაცემა TTS- ის საშუალებით საუბრის მხარდაჭერით. Kokoro- ს რეალურ დროში საუბრის დროს ლოკალური ლოდინი არ სჭირდება. Sesame CSM- ს საუბრის ხმაურიანი გამონატანი აქვს ბუნებრივი დროის მართვით.

LLM პასუხი საუბრის კონვეიერზეName
კოკორო
Sesame CSM- ით საუბარიName
აუდიო გამონატანი

მობილური და ხმის პროგრამებიName

შექმენით ხმაზე მომუშავე მობილური პროგრამები, ხელმისაწვდომობის ინსტრუმენტები, კითხვის პროგრამები და ენის სწავლის პლატფორმები. ჩვენი REST API მუშაობს ნებისმიერ მობილურ ფრეიმვერთან. ჩამოტვირთეთ აუდიო ფაილები ან პირდაპირ კლიენტში გადმოაგზავნეთ.

React Native, Flutter, Swift, KotlinName
დამხმარე და კითხვის პროგრამებიName
ენათა სწავლების პლატფორმებიName
აუდიო შინაარსის შექმნა

პროდუქტებიName

თქვენი SaaS პროდუქტის ხმოვანი შესაძლებლობები. დაამატეთ TTS, STT, ხმოვანი კლონირება და აუდიოს დამუშავება როგორც ფუნქციები თქვენს პლატფორმაში. გამოიყენეთ ჩვენი API როგორც თქვენი ხმოვანი უკან, GPU ინფრასტრუქტურის მართვის გარეშე.

White- label ხმის ფუნქციები
GPU- ს ინფრასტრუქტურა არ არის საჭირო
გამოყენების მიხედვით გადახდა
20+ მოდელი თქვენი მომხმარებლებისთვის

ავტომატიზაციის კონვეინერები

ხმათა გენერაციის ინტეგრირება CI/CD-ს ქსელში, შინაარსის ავტომატიზაცია და პაკეტების დამუშავება. ათასობით აუდიო ფაილის გენერირება ელექტრონული ცხრილების მონაცემებიდან, ვიდეო ჩანაწერების ავტომატიზაცია ან შინაარსის ლოკალიზაციის ქსელის შექმნა.

პაკეტის დამუშავება API- ით
შინაარსის ლოკალიზაციის ნაკადებიName
CI/CD ინტეგრაცია
აუდიოს ავტომატიზაციის ელფოსტა

სრული API დოკუმენტაციის ჩვენება

API- ს სპეციფიკაციები

პროდუქციული პროგრამებისთვის შექმნილიName

20+

TTS მოდელი

100+

ხმებიName

30+

ენაName

<1s

დაგვიანება (Kokoro)

უფასო რეგისტრაცია — 15,000 სიმბოლო

ხშირად დასმული კითხვები

TTS.ai-ის პროგრამისტების API- ს შესახებ გავრცელებული კითხვები

დიახ. ჩვენი API ემყარება OpenAI- ს აუდიო საუბრის ფორმატს. თუ თქვენ იყენებთ OpenAI Python- ს ან JavaScript- ის კლიენტის ბიბლიოთეკას, შეგიძლიათ გადახვიდეთ TTS.ai- ზე base_ url და api_ key პარამეტრების შეცვლით. თქვენი არსებული კოდი მუშაობს ცვლილებების გარეშე.

Kokoro 1 წამზე ნაკლებ დროში ქმნის აუდიოს ტიპიური ფრაზებისთვის. CosyVoice 2 მხარს უჭერს სტრიმინგ გამონატანს, რათა დაფიქსირდეს უფრო დაბალი დაგვიანება. ჩეთბოტებისა და ხმის ასისტენტებისთვის, გზაჯვარედინის დრო 1-3 წამს შეადგენს, რაც დამოკიდებულია ტექსტის სიგრძეზე და მოდელზე.

უფასო მოდელი (Kokoro, Piper, VITS, MeloTTS) ღირს 0 კრედიტი. სტანდარტული მოდელი ღირს 2 კრედიტი 1000 სიმბოლოზე. პრემიუმ მოდელი ღირს 4 კრედიტი 1000 სიმბოლოზე. რეგისტრაცია უფასოა 15 კრედიტით. გეგმები იწყება $9/თვეში 500 კრედიტისთვის.

დიახ. ატვირთეთ რეფერენციული აუდიო ნიმუში (5-30 წამი) ხმის კლონირების დასასრული პუნქტში, შემდეგ კი გამოიყენეთ კლონირებული ხმის ID მომდევნო TTS მოთხოვნებში. მოდელები, რომლებიც მხარს უჭერენ კლონირებას: CosyVoice 2, Chatterbox, Fish Speech და GPT-SoVITS.

უფასო დონეზე ძირითადი სიჩქარის შეზღუდვაა (3 მოთხოვნა საათში ანგარიშის გარეშე). გადახდილი გეგმების სიჩქარის შეზღუდვა უფრო ფართოა და პროდუქციული პროგრამებისთვისაა განკუთვნილი. კომპანიის დონის სიჩქარის მოთხოვნების შესახებ დაგვიკავშირდით.

WAV (დასუსტებული, უმაღლესი ხარისხი), MP3 (დასუსტებული, მცირე ფაილები), OGG (ღია ფორმატი) და FLAC (დასუსტებული, მცირე ფაილები). მიუთითეთ ფორმატის პარამეტრები თქვენს მოთხოვნაში. ნაგულისხმევი ფორმატია WAV მოდელის ინდივიდუალური დისკეტაციის სიხშირით.

დიახ. ჩვენი TTS API- ს კომბინირება საუბრის ტექსტად გადამუშავების მოდელთან და LLM- სთან, სრული ხმაურიანი ასისტენტის შესაქმნელად. Kokoro- ს სთავაზობს მცირე წამიანი ლოდინის შესაძლებლობას, რაც რეალურ დროში საუბრისთვის იდეალურია. CosyVoice 2 მხარს უჭერს ვიდეო გამონატანს, რათა პასუხის გაცემის დრო კიდევ უფრო ნაკლები იყოს.

CosyVoice 2 და Kokoro მხარს უჭერენ აუდიოს გადმოცემას, სადაც აუდიოს ნაწილები გადმოცემულია მათი შექმნის დროს. ეს ამცირებს რეალურ დროში პროგრამების, როგორიცაა ხმაურიანი ასისტენტები და ინტერაქტიული გამოცდილება, პირველი ბაიტის მიღების დროს.

API- ს უკან ბრუნავს სტანდარტული HTTP სტატუსის კოდები. 5xx შეცდომის და სიჩქარის საზღვრის პასუხების შემთხვევაში გამოიყენეთ ექსპონენტური უკან დაბრუნება. მნიშვნელოვანი პროგრამებისთვის დაამატეთ ლოდინი და კიდევ ერთხელ სცადეთ. ჩვენი API- ს აქვს მაღალი მუშაობის დრო, მაგრამ ყოველთვის რეკომენდებულია შეცდომის მართვა.

დიახ. /v1/voices და /v1/models საბოლოო წერტილები იძლევა ყველა ხელმისაწვდომი ხმის და მოდელის JSON სიას მათი მეტა მონაცემებით (ენათა მხარდაჭერა, ხარისხის რეიტინგი, სიჩქარის რეიტინგი და ფასების დონე). გამოიყენეთ ისინი თქვენი პროგრამის დინამიური მოდელის არჩევის შესაქმნელად.

თავისუფალი მოდელები (Kokoro, Piper, VITS, MeloTTS) ეფექტური საცურაო აუზის როლს ასრულებენ, რადგან მათი ღირებულება ნულ კრედიტს შეადგენს. შეამოწმეთ თქვენი ინტეგრაცია თავისუფალ მოდელებთან, შემდეგ გადადით პროდუქტიულ პრემიუმ მოდელებზე მოდელის პარამეტრების შეცვლით. დამოუკიდებელი ტესტირების გარემო არ არის საჭირო.

ჩვენი მოდელის უმეტესობა ღია კოდისაა და შეიძლება თვით- ჰოსტინგი. თუმცა, თვით- ჰოსტინგი მოითხოვს მნიშვნელოვან GPU რესურსებს (ჩვენ ვიყენებთ 4x NVIDIA Tesla P40- ს 96GB VRAM- ით). API უზრუნველყოფს ფასდაკლების ალტერნატივას ინფრასტრუქტურის მართვის გარეშე.

5.0/5 (1)

დჲრჲგ ლთ ჟთ ეა ჟთ ჟრჲპთქ ჟთ დლაჟჲგთწ თნრვლვკრსალვნ ჟთჟრვმა?

მიიღეთ უფასო API ღილაკი და დაიწყეთ მშენებლობა. 50 კრედიტი რეგისტრაციისას, უფასო მოდელები, სრული დოკუმენტაცია.

რეგისტრაცია ფასების ჩვენება

ტექსტიდან საუბრის API პროგრამისტებისთვისName

გამოსცადე ახლა

ჟაკაქ TTS.ai? კაზთ თმ ნა ოპთ£არვლთრვ ჟთ!

პროგრამისტების API ფუნქციებიName

მარტივი REST APIName

OpenAI- თან თავსებადი

ხელმისაწვდომი მოდელები

ქვემეორე დაგვიანება

ხმოვანი კლონირების APIName

მრავალფეროვანი ფორმატი

პროგრამისტების ინტეგრაციის საუკეთესო მოდელიName

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API- ს ინტეგრირებაName

API კოდის მიღება

პირველი ზარის გაგზავნა

მოდელის არჩევა

პროდუქციაში გადატანა

კოდის სწრაფი დაწყების მაგალითები

რასაც პროგრამისტები TTS.ai-ით ქმნიან

AI ჩატი და ასისტენტებიName

მობილური და ხმის პროგრამებიName

პროდუქტებიName

ავტომატიზაციის კონვეინერები

API- ს სპეციფიკაციები

ხშირად დასმული კითხვები

API- ს OpenAI TTS ფორმატთან შეთავსებადობა აქვს?

კაკგჲ ვ ლვრვნთვრჲ ჱა ოპთლთკაŒა გჲ პვალნჲ გპვმვ?

როგორ მუშაობს API-ს გამოყენების ფასები?

მჲზვ ლთ ეა თჱოჲლჱგამ დლაჟჲგჲ კლჲნთპანვ ოპვჱ აპრთკსლარა?

თმა ლთ დპანთუა?

რა აუდიო ფორმატებს უბრუნებს API?

შემიძლია API-ს გამოყენება ხმაურიანი ასისტენტის ან ჩატის ბოტის შესაქმნელად?

არსებობს WebSocket ან სტრიმინგ API?

კაკ ეა ჟვ ჲოპაგწ ჟ დპვქკთრვ თ ოჲგრჲპნთრვ ჲოთრთ გ ოპჲთჱგჲეჟრგჲრჲ?

მჲზვ ლთ ეა ნაოპაგწ ჟოთჟყკ ჟ ნალთფნთრვ დლაჟჲგვ თ მჲევლთ?

თმა ლთ ჟვმბლთჱთპანა ჟპვეა ჱა თჱმვნა ნა ჟყჲბღვნთწრ ჟთ ოყრ?

მჲზვ ლთ ეა ჟვ ჟამჲჟრჲწგამ ჟ მჲევლთრვ, ნაპვე ეა თჱოჲლჱგამ აპრთკსლა?

დჲრჲგ ლთ ჟთ ეა ჟთ ჟრჲპთქ ჟთ დლაჟჲგთწ თნრვლვკრსალვნ ჟთჟრვმა?