PGVector est une extension PostgreSQL qui permet de stocker des vecteurs (embeddings) et d’effectuer de la recherche par similarité directement dans la base. Elle est utile pour des cas RAG simples à intermédiaires, lorsque l’on veut éviter d’ajouter une base vectorielle dédiée. Le compromis : simplicité d’architecture contre performances et fonctionnalités parfois moins spécialisées qu’une vector DB.
Chez Josh, nous l’utilisons quand l’objectif est de démarrer vite un RAG en restant dans l’écosystème Postgres, avec un pipeline d’ingestion maîtrisé et des volumes raisonnables. Nous cadrons le chunking, les métadonnées et la stratégie de requêtes, puis nous mesurons la qualité et la latence. Si le volume grandit, nous gardons la possibilité de basculer vers une base vectorielle dédiée sans casser le produit.

PGVector est idéal pour un RAG pragmatique : on garde Postgres comme socle et on ajoute la recherche sémantique sans multiplier les briques. On surveille la latence et on bascule vers une vector DB dédiée si l’échelle l’exige.
Damien — Tech lead Mistral AI
Nous sommes experts dans des technologies de pointe pour repousser au maximum toutes les limites techniques. Nous sommes prêts à relever les défis les plus complexes et à façonner l'avenir numérique avec audace et détermination.