Fine-tuning · suivi · employé IA ● temps réel (4s)

Employé IA · qwen3-8b

—

Trajectoire d'apprentissage

tool_accuracy arg_accuracy no_call_accuracy json_validity

dernier round — à cibler au prochain tour

Les catégories les plus hautes guident la génération ciblée du round suivant (active learning).

en attente de pipeline_stats.json

▸ Teacher (génération)

▸ Coûts OpenRouter

proposés → schéma → règles → GPT-5.5 → DeepSeek V4 Pro → gardés

Un exemple n'est gardé que si les deux juges notent ≥ 4. Le funnel montre où chaque exemple est rejeté.

taux d'acceptation sur les exemples qu'ils ont vus