Résultat d'exemple — cliquez sur Lancer pour générer le vôtre.
La tarification au token récompense les prompts efficaces et les sorties courtes, ce qui convient aux équipes expérimentées mais pénalise les débutants dont les longs system prompts font gonfler silencieusement chaque facture. La tarification à la requête est prévisible — un CFO peut prévoir à partir du seul volume d'appels — mais surfacture les petites requêtes et sous-facture les générations longues : c'est le fournisseur qui absorbe la variance.
Dans les marchés émergents, la prévisibilité l'emporte plus souvent qu'elle ne perd : une équipe qui paie en F CFA sans carte de crédit préfère généralement une facture plate qu'elle peut rapprocher d'un relevé Wave à un compteur au token moins cher sur le papier mais non auditable. Un bon compromis : une tarification forfaitaire à étages avec un dépassement au token divulgué d'avance — on garde la prévisibilité qui gagne les budgets tout en préservant l'incitation à l'efficacité pour les équipes qui grandissent.