Audio

Points d'accès de synthèse vocale et de transcription (Whisper) pour générer de l'audio à partir de texte et convertir des fichiers audio en texte.

Tchavi prend en charge deux points d'accès audio : la synthèse vocale (TTS) pour générer de l'audio à partir de texte, et la transcription (Whisper) pour convertir des fichiers audio en texte.

Synthèse vocale

POST/v1/audio/speech

Convertit du texte en audio parlé. Renvoie des octets audio bruts.

ParamètreTypeRequisDescription
modelstringOui« tts-1 » (plus rapide) ou « tts-1-hd » (qualité supérieure)
inputstringOuiLe texte à convertir en parole (max 4096 caractères)
voicestringOuialloy, ash, ballad, cedar, coral, echo, fable, marin, nova, onyx, sage, shimmer
response_formatstringNonmp3, opus, aac, flac, wav, pcm. Par défaut : mp3
speednumberNonVitesse de lecture 0.25–4.0. Par défaut : 1.0
import Tchavi from '@tchavi/sdk';
import { writeFileSync } from 'fs';

const client = new Tchavi({ apiKey: 'YOUR_API_KEY' });

const response = await client.audio.speech.create({
  model: 'tts-1',
  input: 'Tchavi est la meilleure passerelle d\'API IA en Afrique.',
  voice: 'nova',
  response_format: 'mp3',
});

const buffer = Buffer.from(await response.arrayBuffer());
writeFileSync('speech.mp3', buffer);

Transcription (Whisper)

POST/v1/audio/transcriptions

Transcrit des fichiers audio en texte. Envoyez en multipart/form-data.

ParamètreTypeRequisDescription
modelstringOui« whisper-1 »
filefileOuiFichier audio (mp3, wav, m4a, webm, ogg…). Max 25 Mo
languagestringNonCode ISO-639-1 (par ex. « fr », « en »). Détecté automatiquement si omis
response_formatstringNonjson, text, srt, vtt, verbose_json. Par défaut : json
promptstringNonTexte facultatif pour guider le style du modèle ou poursuivre un segment précédent. Doit correspondre à la langue de l'audio.
temperaturenumberNonTempérature d'échantillonnage 0–1. Des valeurs plus élevées produisent des transcriptions plus variées. Par défaut : 0
import Tchavi from '@tchavi/sdk';
import { createReadStream } from 'fs';

const client = new Tchavi({ apiKey: 'YOUR_API_KEY' });

const result = await client.audio.transcriptions.create({
  model: 'whisper-1',
  file: createReadStream('audio.mp3'),
  language: 'fr',
});

console.log(result.text);
console.log('Durée :', result.tchavi.duration_minutes, 'min');
console.log('Crédits utilisés :', result.tchavi.credits_used);

Sur cette page