Résultat d'exemple — cliquez sur Lancer pour générer le vôtre.
Le prompt caching permet au modèle de réutiliser son travail sur un préfixe déjà vu — donc si tu envoies le même long system prompt à chaque appel, tu ne paies son traitement qu'une seule fois. Les appels suivants qui partagent ce préfixe reviennent plus vite et à une fraction du prix d'entrée habituel.