Dépannage¶
Problèmes courants et leurs solutions lors de l'exécution de HYDRA × PDX.
HYDRA¶
Le serveur SSH ne démarre pas¶
Symptôme : OSError: [Errno 98] Address already in use
Le port est déjà occupé. Vérifiez ce qui l'utilise :
Si c'est une instance HYDRA précédente qui ne s'est pas arrêtée proprement :
Erreurs API Groq¶
Symptôme : GroqError: 429 Rate limit exceeded
Solutions :
- Augmenter le TTL du cache — Dans
.env, mettezLLM_CACHE_TTL=600(10 minutes) - Augmenter la taille du cache —
LLM_CACHE_SIZE=500 - Passer au tier payant Groq — Limites significativement plus élevées
Les sessions se déconnectent immédiatement¶
La plupart sont des scanners bot_ephemeral — ils sondent le port mais ne s'authentifient pas. C'est normal (72,7 % du trafic). Si toutes les sessions se déconnectent (y compris vos tests) :
- Vérifiez que les clés SSH existent dans
config/ - Vérifiez que
.enva uneGROQ_API_KEYvalide - Vérifiez que les dépendances Python sont installées
Incohérence VFS¶
Si un attaquant crée un fichier mais ls ne le montre pas, vérifiez si la commande a été gérée par le LLM plutôt que le handler built-in. Seules les commandes built-in (mkdir, touch, rm, echo >) déclenchent des mutations d'état.
PDX¶
Le DataRouter produit une sortie vide¶
- Pas de sessions signal — Vérifiez
split_stats.jsonpour les comptages par label - Mauvais répertoire de logs — Vérifiez le chemin
- JSONL corrompu — Le DataRouter saute les lignes malformées mais logue des warnings
Le fine-tuning manque de VRAM¶
| VRAM | Modèle | Rang LoRA | Batch size |
|---|---|---|---|
| 8 Go | Qwen 2.5 7B | 8 | 1–2 |
| 12 Go | Qwen 2.5 7B | 16 | 2–4 |
| 16 Go | Qwen 2.5 14B | 16 | 2 |
| 24 Go | Llama 3.3 8B | 32 | 4–8 |
Vérifiez si Ollama tourne : nvidia-smi
Déploiement¶
Le build Cloudflare Pages échoue¶
Assurez-vous que la variable d'environnement PYTHON_VERSION est définie à 3.12 dans les paramètres de build Cloudflare Pages.
Le sous-domaine ne résout pas¶
- Vérifiez l'enregistrement CNAME dans Cloudflare DNS
- Vérifiez que le domaine est listé dans Custom domains de votre projet Pages
- Les certificats SSL peuvent prendre jusqu'à 24h
Obtenir de l'aide¶
Si votre problème n'est pas listé ici, ouvrez une issue sur GitHub avec le message d'erreur complet, votre version Python, votre OS et la commande exécutée.