Aurora Nexus
Aurora NexusIntroduction

Glossaire & conventions

vocabulaire (`tenant_id`, `pack_id`, `source_app`, `caller_app`, etc.)

Ce glossaire fixe les termes utilisés dans Aurora Nexus (docs, UI, API, logs).

Identifiants & périmètres

  • tenant_id : identifiant de l’organisation (le client) dans l’instance. En mode mono‑tenant, il est stable à l’échelle du déploiement.
  • pack_id : périmètre “dataset” au sein d’un même client (ex : CV, Clients, Missions). Sert à isoler/filtrer des bases de connaissance.
  • source_app : application “productrice/consommatrice” de contenu (ex : notes, veille, default). Sert à tracer et filtrer les documents/citations.
  • caller_app : application appelante pour les requêtes LLM/RAG (ex : une application externe connectée via l’API Nexus). Sert à piloter observabilité, quotas, sécurité.

Concepts produit

  • Service : regroupement fonctionnel (souvent associé à un prompt et des paramètres RAG) : “Juridique”, “Support”, “Finance”, etc.
  • Workspace : périmètre d’organisation côté UI pour classer/filtrer les conversations et documents.
  • Prompt de service : instructions de comportement/rendu pour un service (format, style, règles).

RAG & retrieval

  • Chunk : fragment de document indexé (texte + métadonnées + vecteur).
  • k / RETRIEVE_K : nombre de chunks retenus pour le contexte final.
  • fetch_k / FETCH_K : nombre de candidats ramenés avant diversification MMR.
  • MMR (mmr_lambda) : diversification des chunks (équilibre pertinence vs diversité).

Cache LLM (Gateway)

  • Cache exact (Postgres) : réutilise une réponse uniquement si la requête correspond exactement (clé stable).
  • Cache sémantique (Qdrant) : réutilise une réponse si la requête est “proche” (embedding), avec seuil et top‑k.
  • Modes : disabled, exact, semantic, mixed.

Logs & audit

  • queries_log : journal des requêtes (statut, latence, coûts, cache, diagnostics retrieval).
  • config_audit_log : audit des changements de configuration (prompts, providers, cache, etc.).

On this page