Aurora NexusConfiguration
Réglages RAG : valeurs par défaut selon la physionomie des données
réglages RAG recommandés selon vos données (workspace override → service)
Nexus propose plusieurs réglages de retrieval (récupération des passages/chunks) qui influencent fortement la qualité des réponses.
Où configurer ?
- Service (source_app) : Admin → Services → « Profil RAG »
- Workspace : Admin → Services → Workspaces → Modifier → section RAG (override workspace → service)
- Priorité :
workspace override > service > global- Si un champ est vide au niveau workspace, Nexus hérite du service.
Modes de retrieval
dense_mmr(défaut) : recherche dense (embeddings) + diversification MMR.hybrid_rrf: fusion dense + sparse (RRF) via Qdrant.
hybrid_rrf nécessite que la collection Qdrant soit créée en mode hybrid (voir QDRANT_HYBRID_ENABLED dans .env).
Paramètres
- Top K (
retrieve_k) : nombre final de chunks envoyés au LLM. - Fetch K (
fetch_k) : nombre de candidats “pré-sélectionnés” (dense_mmr) ou fallback de prefetch (hybrid_rrf). - MMR λ (
mmr_lambda) : uniquement utile endense_mmr(0 = diversité max, 1 = pertinence max). - Hybrid prefetch dense/sparse K : uniquement utile en
hybrid_rrf(nombre de candidats par branche avant fusion RRF).
Recommandations de départ
1) Gros corpus mono-sujet (200–10 000 pages sur le même thème)
Objectif : rappel (ne rien rater) tout en gardant une diversité de sources.
- Mode :
hybrid_rrf retrieve_k: 8–12hybrid_prefetch_dense_k: 40–80hybrid_prefetch_sparse_k: 40–80fetch_k: laisser au défaut (ou 40) si vous ne renseignez pas les champs prefetch
2) Beaucoup de documents indépendants (ex. 100 000 documents d’1 page)
Objectif : précision, éviter le bruit (peu de redondance, beaucoup de “one-shots”).
- Mode :
dense_mmr retrieve_k: 3–6fetch_k: 10–30mmr_lambda: 0.3–0.6
3) Corpus “RH mixte” (CV + contrats + conventions collectives dans un même service)
Objectif : garder un service unique, mais adapter la récupération selon la nature du workspace.
- Service (fallback) :
dense_mmr,retrieve_k=4,fetch_k=15,mmr_lambda=0.5 - Workspace CV :
dense_mmr,retrieve_k=3,fetch_k=12,mmr_lambda=0.4 - Workspace Conventions / Réglementaire :
hybrid_rrf,retrieve_k=10,hybrid_prefetch_dense_k=60,hybrid_prefetch_sparse_k=60
Diagnostic (quand “ça ne marche pas”)
Symptômes courants et pistes rapides :
- Réponse hors-sujet → baissez
retrieve_k(bruit), augmentezfetch_k(rappel), vérifiez les filtres (service/workspace). - Réponse qui “oublie” une info pourtant présente → testez
hybrid_rrfet augmentez les prefetch K. - Réponse redondante → en
dense_mmr, baissezmmr_lambda(plus de diversité).