Aller au contenu

Dépannage

Problèmes courants et leurs solutions lors de l'exécution de HYDRA × PDX.

HYDRA

Le serveur SSH ne démarre pas

Symptôme : OSError: [Errno 98] Address already in use

Le port est déjà occupé. Vérifiez ce qui l'utilise :

sudo ss -tlnp | grep 2222

Si c'est une instance HYDRA précédente qui ne s'est pas arrêtée proprement :

sudo lsof -i :2222
sudo kill -9 <PID>

Erreurs API Groq

Symptôme : GroqError: 429 Rate limit exceeded

Solutions :

  1. Augmenter le TTL du cache — Dans .env, mettez LLM_CACHE_TTL=600 (10 minutes)
  2. Augmenter la taille du cacheLLM_CACHE_SIZE=500
  3. Passer au tier payant Groq — Limites significativement plus élevées

Les sessions se déconnectent immédiatement

La plupart sont des scanners bot_ephemeral — ils sondent le port mais ne s'authentifient pas. C'est normal (72,7 % du trafic). Si toutes les sessions se déconnectent (y compris vos tests) :

  • Vérifiez que les clés SSH existent dans config/
  • Vérifiez que .env a une GROQ_API_KEY valide
  • Vérifiez que les dépendances Python sont installées

Incohérence VFS

Si un attaquant crée un fichier mais ls ne le montre pas, vérifiez si la commande a été gérée par le LLM plutôt que le handler built-in. Seules les commandes built-in (mkdir, touch, rm, echo >) déclenchent des mutations d'état.

PDX

Le DataRouter produit une sortie vide

  1. Pas de sessions signal — Vérifiez split_stats.json pour les comptages par label
  2. Mauvais répertoire de logs — Vérifiez le chemin
  3. JSONL corrompu — Le DataRouter saute les lignes malformées mais logue des warnings

Le fine-tuning manque de VRAM

VRAM Modèle Rang LoRA Batch size
8 Go Qwen 2.5 7B 8 1–2
12 Go Qwen 2.5 7B 16 2–4
16 Go Qwen 2.5 14B 16 2
24 Go Llama 3.3 8B 32 4–8

Vérifiez si Ollama tourne : nvidia-smi

Déploiement

Le build Cloudflare Pages échoue

Assurez-vous que la variable d'environnement PYTHON_VERSION est définie à 3.12 dans les paramètres de build Cloudflare Pages.

Le sous-domaine ne résout pas

  1. Vérifiez l'enregistrement CNAME dans Cloudflare DNS
  2. Vérifiez que le domaine est listé dans Custom domains de votre projet Pages
  3. Les certificats SSL peuvent prendre jusqu'à 24h

Obtenir de l'aide

Si votre problème n'est pas listé ici, ouvrez une issue sur GitHub avec le message d'erreur complet, votre version Python, votre OS et la commande exécutée.