Aurora NexusIntroduction
Glossaire & conventions
vocabulaire (`tenant_id`, `pack_id`, `source_app`, `caller_app`, etc.)
Ce glossaire fixe les termes utilisés dans Aurora Nexus (docs, UI, API, logs).
Identifiants & périmètres
tenant_id: identifiant de l’organisation (le client) dans l’instance. En mode mono‑tenant, il est stable à l’échelle du déploiement.pack_id: périmètre “dataset” au sein d’un même client (ex :CV,Clients,Missions). Sert à isoler/filtrer des bases de connaissance.source_app: application “productrice/consommatrice” de contenu (ex :notes,veille,default). Sert à tracer et filtrer les documents/citations.caller_app: application appelante pour les requêtes LLM/RAG (ex : une application externe connectée via l’API Nexus). Sert à piloter observabilité, quotas, sécurité.
Concepts produit
- Service : regroupement fonctionnel (souvent associé à un prompt et des paramètres RAG) : “Juridique”, “Support”, “Finance”, etc.
- Workspace : périmètre d’organisation côté UI pour classer/filtrer les conversations et documents.
- Prompt de service : instructions de comportement/rendu pour un service (format, style, règles).
RAG & retrieval
- Chunk : fragment de document indexé (texte + métadonnées + vecteur).
k/RETRIEVE_K: nombre de chunks retenus pour le contexte final.fetch_k/FETCH_K: nombre de candidats ramenés avant diversification MMR.- MMR (
mmr_lambda) : diversification des chunks (équilibre pertinence vs diversité).
Cache LLM (Gateway)
- Cache exact (Postgres) : réutilise une réponse uniquement si la requête correspond exactement (clé stable).
- Cache sémantique (Qdrant) : réutilise une réponse si la requête est “proche” (embedding), avec seuil et top‑k.
- Modes :
disabled,exact,semantic,mixed.
Logs & audit
queries_log: journal des requêtes (statut, latence, coûts, cache, diagnostics retrieval).config_audit_log: audit des changements de configuration (prompts, providers, cache, etc.).