Fine-tuning · suivi · employé IA ● temps réel (4s)

Employé IA · qwen3-8b

Trajectoire d'apprentissage

tool_accuracy arg_accuracy no_call_accuracy json_validity

Avant / Après

Erreurs par catégorie

dernier round — à cibler au prochain tour
Les catégories les plus hautes guident la génération ciblée du round suivant (active learning).

Distillation · teacher & juges

en attente de pipeline_stats.json
▸ Teacher (génération)
▸ Coûts OpenRouter

Entonnoir de validation (2 juges)

proposés → schéma → règles → GPT-5.5 → DeepSeek V4 Pro → gardés
Un exemple n'est gardé que si les deux juges notent ≥ 4. Le funnel montre où chaque exemple est rejeté.

Sévérité des juges

taux d'acceptation sur les exemples qu'ils ont vus