MemPalace : le Système de Mémoire IA Open Source Qui Retient Tout Pour Vos Agents

Niels
Niels Co-founder
Publié le 10 avr. 2026Mis à jour le 12 avr. 2026

Vos agents IA oublient tout à chaque nouvelle session. Six mois de conversations, des milliers de décisions, des centaines de fichiers analysés, et pourtant, chaque matin, votre assistant repart de zéro. Ce problème fondamental freine l'adoption des agents autonomes dans les workflows professionnels, de la prospection B2B à la gestion de projet. MemPalace, un projet open source lancé le 5 avril 2026, propose une solution radicale : stocker absolument tout, sans résumé ni perte, et rendre chaque information retrouvable en 170 tokens.

Le projet a atteint 38 000 étoiles GitHub en moins d'une semaine, provoquant autant d'enthousiasme que de polémique. Derrière ce système se cache une architecture inspirée d'une technique mnémonique vieille de 2 500 ans, adaptée aux modèles de langage modernes. Voici tout ce que vous devez savoir avant de l'adopter.

Milla Jovovich et Ben Sigman : le duo inattendu derrière MemPalace

L'une des particularités de MemPalace est l'identité de ses créateurs. Milla Jovovich, actrice connue pour la franchise Resident Evil, s'est associée à Ben Sigman, ingénieur logiciel et entrepreneur dans la crypto, pour concevoir ce système. Jovovich n'est pas simplement l'ambassadrice du projet : elle en est l'architecte, tandis que Sigman en assure le développement technique.

Milla Jovovitch picture

L'idée est née d'une frustration partagée par des millions d'utilisateurs de ChatGPT et Claude : après des mois de conversations quotidiennes avec l'IA, chaque nouvelle session repart de zéro. Jovovich a décrit son expérience en ces termes : elle avait accumulé des centaines d'heures de conversations riches avec des modèles de langage, mais aucun ne se souvenait de la session précédente. La frustration était d'autant plus grande que les solutions existantes, qu'elles soient payantes ou open source, demandaient à un LLM de résumer ce qui comptait, perdant inévitablement des nuances et du contexte.

Le choix du nom MemPalace fait référence à la méthode des loci, une technique mnémonique de la Grèce antique où l'on associe des informations à des pièces d'un bâtiment mental. Le pari de Jovovich et Sigman est que cette métaphore spatiale, qui fonctionne pour le cerveau humain, peut aussi organiser la mémoire des IA de manière plus efficace qu'un simple dump vectoriel.

Ben Sigman picture

Le lancement a été fulgurant : 5 400 étoiles GitHub en 24 heures, puis 21 700 en trois jours, et plus de 38 000 en une semaine. Brian Roemmele, figure influente de la communauté IA, a publiquement déclaré avoir déployé MemPalace pour 79 de ses employés, qualifiant le système de « chef-d'oeuvre ». Mais cette ascension fulgurante a aussi attiré les critiques, notamment sur les revendications de benchmark que nous analyserons plus loin.

Pourquoi vos agents IA souffrent d'amnésie chronique

Le problème de la mémoire persistante est devenu le goulet d'étranglement numéro un des agents IA en production. Que vous utilisiez Claude Code, ChatGPT, Cursor ou un agent personnalisé via MCP, chaque nouvelle session démarre avec un contexte vierge. Les solutions actuelles sont insatisfaisantes.

Les fichiers de contexte comme CLAUDE.md ou AGENTS.md grossissent rapidement jusqu'à consommer une part significative de la fenêtre de contexte. Les résumés générés par IA perdent inévitablement des détails critiques, car c'est le modèle qui décide ce qui est « important ». Les solutions cloud payantes comme Mem0 (19 à 249 dollars par mois) ou Zep (à partir de 25 dollars par mois) ajoutent une dépendance externe et un coût récurrent qui explose avec l'usage.

Pour un SaaS B2B qui utilise des agents pour automatiser la prospection, le support client ou l'analyse de données, cette amnésie signifie des erreurs répétées, des recommandations incohérentes et une perte de contexte qui frustre les utilisateurs finaux. Imaginez un agent de prospection qui oublie chaque matin les 200 objections analysées la veille, ou un agent de support qui ne retient pas les solutions qui ont fonctionné la semaine précédente. Le coût en productivité est considérable, et c'est précisément ce problème que MemPalace cherche à résoudre.

Qu'est-ce que MemPalace et comment fonctionne-t-il?

Mempalace Logo

MemPalace est un système de mémoire open source (licence MIT) qui donne aux modèles de langage une mémoire persistante entre les sessions. Contrairement aux alternatives qui résument et filtrent vos données, MemPalace stocke tout de manière verbatim, c'est-à-dire mot pour mot, puis organise ces données dans une architecture hiérarchique inspirée de la méthode des loci.

La méthode des loci, ou technique du palais de la mémoire, est une stratégie mnémonique utilisée depuis la Grèce antique. Le principe consiste à associer des informations à des emplacements spatiaux dans un bâtiment mental. MemPalace transpose cette idée au stockage sémantique pour l'IA.

Le système repose sur deux technologies locales : ChromaDB pour le stockage vectoriel et la recherche sémantique, et SQLite pour le graphe de connaissances temporel. Aucune API externe n'est appelée en mode standard. Vos données ne quittent jamais votre machine.

L'installation se fait en trois commandes :

bash

pip install mempalace
mempalace init ~/projects/monprojet
mempalace mine ~/projects/monprojet

L'architecture du palais : Wings, Rooms, Halls et Tunnels

L'organisation des données dans MemPalace suit une hiérarchie spatiale qui améliore la précision de recherche de 34 % par rapport à une recherche vectorielle classique.

Les Wings constituent le niveau supérieur. Chaque projet ou personne obtient sa propre aile dans le palais. Si vous gérez plusieurs campagnes de prospection, chaque client peut avoir son wing dédié contenant tout l'historique des échanges, décisions et résultats.

Les Rooms divisent chaque wing en sous-thèmes. Dans un wing « Campagne Emelia Client X », vous pourriez avoir des rooms pour le ciblage, la rédaction des séquences, les résultats A/B, les objections rencontrées et les optimisations successives.

Les Halls sont des corridors transversaux qui traversent tous les wings. Ils catégorisent les types de mémoire : hall_facts pour les décisions verrouillées, hall_events pour les sessions et jalons, hall_discoveries pour les découvertes, hall_preferences pour les habitudes et opinions, et hall_advice pour les recommandations.

Les Tunnels créent des connexions entre wings différents. Si deux projets partagent une problématique similaire, un tunnel relie automatiquement les rooms concernées.

Les Closets stockent des résumés compressés au format AAAK (environ 30x de compression), tandis que les Drawers conservent les fichiers originaux verbatim, jamais supprimés.

Portée de recherche

Recall@10

Amélioration

Tous les closets (recherche plate)

60,9 %

Baseline

Dans le wing

73,1 %

+12 %

Wing + hall

84,8 %

+24 %

Wing + room

94,8 %

+34 %

Cette amélioration de 34 % provient uniquement de l'organisation structurelle, sans aucune sophistication algorithmique supplémentaire. ChromaDB fait le travail de recherche vectorielle, MemPalace apporte la structure qui réduit le bruit.

Le système de mémoire en 4 couches : 170 tokens pour tout retenir

L'innovation la plus marquante de MemPalace est son système de chargement progressif en quatre couches, qui permet de démarrer une session avec seulement 170 tokens tout en ayant accès à l'intégralité de la mémoire.

La couche L0 (Identity) charge environ 50 tokens contenant l'identité de base : qui vous êtes, quel est le projet principal, quelles sont les conventions critiques. Cette couche est toujours présente dans le prompt système.

La couche L1 (Critical Facts) ajoute environ 120 tokens de faits essentiels compressés au format AAAK. Par exemple, la structure d'une équipe de cinq personnes avec leurs rôles et expertises tient en une ligne : TEAM: PRI(lead) | KAI(backend,3yr) SOR(frontend). Ce format reste nativement lisible par tous les LLM sans décodeur.

La couche L2 (Room Recall) charge le contexte spécifique à la room active, à la demande. Quand vous travaillez sur le ciblage d'une campagne, seules les mémoires de cette room sont injectées.

La couche L3 (Deep Search) effectue une recherche sémantique profonde dans l'ensemble du palais, déclenchée par l'utilisateur ou l'agent quand une information spécifique est nécessaire.

Approche

Tokens chargés

Coût annuel estimé

Tout charger en brut

19,5 M

Impossible

Résumés LLM

650 000

507 $

MemPalace au démarrage

170

0,70 $

MemPalace + 5 recherches

13 500

10 $

La différence est spectaculaire. Pour un outil de prospection B2B qui lance des centaines de sessions par jour, passer de 507 dollars à 10 dollars par an en coûts de mémoire change l'équation économique.

Le graphe de connaissances temporel : quand les faits expirent

MemPalace ne se contente pas de stocker des faits, il gère leur validité dans le temps. Le graphe de connaissances temporel, basé sur SQLite, attribue à chaque information une fenêtre de validité avec un champ valid_from et un champ ended.

Cette fonctionnalité résout un problème critique des fichiers de contexte classiques : l'accumulation d'informations obsolètes. Quand votre fichier CLAUDE.md contient des centaines de lignes, certaines datant de plusieurs mois, le modèle ne sait pas distinguer les décisions encore valides de celles qui ont été révisées. MemPalace invalide automatiquement les faits périmés.

Pour la prospection B2B, cette capacité est particulièrement précieuse. Les informations sur un prospect évoluent constamment : changement de poste, nouvelle levée de fonds, pivot stratégique. Un agent équipé de MemPalace peut interroger l'état actuel d'un contact tout en conservant l'historique complet de la relation.

python

# Requête temporelle : état actuel d'un contact
mempalace search "John Smith position actuelle" --temporal current

# Requête historique : évolution de la relation
mempalace search "John Smith" --temporal all

Les agents spécialistes : chaque rôle a sa propre mémoire

MemPalace introduit le concept d'agents spécialistes, chacun maintenant un journal indépendant et une mémoire de domaine spécifique. Cette approche est particulièrement pertinente pour les équipes qui utilisent plusieurs agents IA en parallèle.

Dans le répertoire ~/.mempalace/agents/, vous pouvez créer des profils spécialisés. Un agent reviewer accumule des patterns de revue de code et des historiques de bugs. Un agent architect conserve les décisions de design et les compromis techniques. Un agent ops mémorise les déploiements, incidents et configurations d'infrastructure.

Pour une équipe commerciale B2B, cette architecture se transpose naturellement. Un agent prospecteur mémorise les objections rencontrées, les accroches qui fonctionnent et les patterns de réponse par secteur. Un agent analyste retient les métriques de campagne, les benchmarks par industrie et les corrélations identifiées. Un agent rédacteur accumule les formulations performantes, les taux d'ouverture par type d'objet et les préférences stylistiques du client.

Chaque agent enrichit son expertise session après session, sans polluer la mémoire des autres. Le résultat est un véritable effet d'apprentissage cumulatif que les solutions actuelles ne permettent pas.

Intégration MCP : compatible Claude Code, ChatGPT, Cursor et Gemini

MemPalace s'intègre nativement avec l'écosystème MCP (Model Context Protocol), le standard ouvert récemment transféré à la Linux Foundation via l'Agentic AI Foundation. Cette compatibilité signifie que le système fonctionne avec tous les clients MCP majeurs sans configuration spécifique.

Pour Claude Code, l'intégration se fait en deux commandes :

bash

claude mcp add mempalace -- python -m mempalace.mcp_server

Le serveur MCP expose 19 outils que l'IA appelle automatiquement : recherche sémantique, stockage de mémoire, requêtes sur le graphe de connaissances, gestion des journaux d'agents spécialistes.

MemPalace inclut également des hooks automatiques qui se déclenchent toutes les 15 interactions pour extraire et stocker les sujets, décisions et changements de code sans intervention manuelle. Un hook PreCompact sauvegarde d'urgence la mémoire avant la compression du contexte, évitant toute perte lors des longues sessions.

Pour les modèles locaux (Llama, Mistral, Gemma), le mode wake-up charge les 170 tokens de faits critiques directement dans le prompt système, tandis que la recherche CLI permet des requêtes à la demande. Cette flexibilité multi-plateforme est un atout majeur : vous n'êtes pas enfermé dans un écosystème unique, et vous pouvez utiliser MemPalace avec le modèle et le client de votre choix.

L'intégration via le marketplace de plugins Claude Code simplifie encore l'adoption :

bash

claude plugin marketplace add milla-jovovich/mempalace
claude plugin install --scope user mempalace

Une fois installé, MemPalace fonctionne de manière transparente en arrière-plan, sans modification de vos habitudes de travail.

Le benchmark LongMemEval : 96,6 % de score et la polémique du 100 %

Les performances de MemPalace sur le benchmark LongMemEval méritent une analyse nuancée. En mode raw (stockage verbatim sans API externe), le système atteint 96,6 % de Recall@5 sur 500 questions, ce qui en fait le système gratuit le plus performant disponible.

En mode hybride, qui ajoute un reranking par LLM cloud (coûtant environ 0,001 dollar par requête), le score monte à 100 %. C'est ce chiffre que l'équipe a initialement mis en avant dans sa communication, provoquant une controverse légitime.

La communauté a rapidement identifié que le score parfait avait été obtenu après des corrections ciblées sur les trois questions spécifiques qui échouaient précédemment. L'équipe a testé, identifié les erreurs, engineeré des corrections, puis re-testé sur les mêmes questions pour afficher un score parfait. Ben Sigman a depuis mis à jour la communication pour mettre en avant le score de 96,6 % comme référence principale.

Système

Score LongMemEval

Coût mensuel

Local

MemPalace (raw)

96,6 %

Gratuit

Oui

MemPalace (hybride)

100 %

Environ 0,30 $

Partiellement

Supermemory

Environ 99 %

Payant

Non

Mem0

Environ 85 %

19 a 249 $

Non

Zep

Environ 82 %

25 $+

Non

Hindsight

91,4 %

Open source

Oui

Il est important de noter que ces benchmarks ne mesurent pas tous la même chose. MemPalace mesure le retrieval recall, tandis que Mem0 et Zep reportent un score de QA end-to-end. La comparaison directe est donc imparfaite. Cependant, le rapport qualité-prix de MemPalace reste remarquable : 96,6 % de performance pour zéro dollar de coût récurrent.

Les limites et problèmes connus de MemPalace

Aucun outil n'est parfait, et MemPalace ne fait pas exception. Voici les limitations à connaître avant de l'adopter.

La compression AAAK, présentée comme une innovation majeure, fait baisser le score de benchmark de 96,6 % à 84,2 %. Le format de compression par abréviations, bien que lisible par les LLM, introduit une perte d'information mesurable. Pour des cas d'usage où la précision est critique, le mode raw reste recommandé.

L'économie de tokens annoncée par AAAK est également contestée. Une validation avec un tokenizer réel a montré que l'exemple du README passait de 73 à 66 tokens, soit une compression bien inférieure au ratio de 30x affiché. L'équipe a reconnu cette erreur et travaille à corriger les exemples.

Côté technique, plusieurs problèmes ouverts affectent la stabilité. Un segfault sur macOS ARM64 (issue 74), une injection shell dans les hooks (issue 110), et des problèmes de pinning de version ChromaDB (issue 100) sont documentés sur le dépôt.

La détection de contradictions, mentionnée dans la documentation, n'est pas encore intégrée automatiquement dans les opérations du graphe de connaissances. Elle existe comme utilitaire séparé, ce qui limite son utilité en production.

Enfin, MemPalace requiert un environnement Python 3.9+, la configuration d'un serveur MCP et la mise en place de hooks. Pour des projets simples nécessitant uniquement des conventions de codage, un fichier CLAUDE.md reste plus approprié.

Cas d'usage concrets pour la prospection B2B et les SaaS

Au-delà du développement logiciel, MemPalace ouvre des perspectives intéressantes pour les professionnels du B2B et les équipes commerciales qui intègrent l'IA dans leurs workflows.

Pour la prospection email automatisée, un agent équipé de MemPalace retient les objections type par secteur, les formulations qui ont généré les meilleurs taux de réponse, et les préférences de communication de chaque prospect contacté. Session après session, l'agent affine ses recommandations sans repartir d'une page blanche.

Pour l'analyse de campagne, le graphe de connaissances temporel permet de tracker l'évolution des métriques dans le temps. Au lieu de recharger manuellement les données de performance à chaque session d'optimisation, l'agent accède instantanément à l'historique complet et identifie les tendances.

Pour le support client SaaS, des agents spécialistes par domaine produit accumulent une expertise sur les problèmes récurrents, les solutions efficaces et les cas limites. Chaque ticket résolu enrichit la base de connaissances de l'agent, réduisant progressivement le temps de résolution.

Pour les équipes de contenu SEO, un agent rédacteur mémorise les guidelines éditoriales, les performances par type d'article et les corrections demandées. Le résultat est une amélioration continue de la qualité sans briefing répétitif.

Prenons un exemple concret. Une agence B2B gère 15 campagnes de prospection email en parallèle pour des clients différents. Chaque campagne a ses propres personas cibles, objections fréquentes, accroches performantes et métriques. Sans mémoire persistante, l'agent de l'agence doit recharger toutes ces informations à chaque session. Avec MemPalace, chaque campagne a son wing dédié, les meilleures pratiques cross-clients sont accessibles via les halls, et les agents spécialistes par client accumulent une expertise qui s'affine au fil des semaines. L'agent peut instantanément comparer les taux de réponse entre deux campagnes similaires dans des secteurs différents, identifier les patterns qui fonctionnent, et appliquer ces insights sans qu'un humain ait besoin de tout re-briefer.

Comment MemPalace se compare à Mem0, Zep et Hindsight

Le marché de la mémoire pour agents IA est encore jeune, mais plusieurs acteurs se disputent déjà la place. Voici comment MemPalace se positionne par rapport à ses principaux concurrents.

Mem0, soutenu par Y Combinator et utilisé par plus de 50 000 développeurs, offre une plateforme managée avec une option cloud et une version auto-hébergée. Son approche consiste à utiliser un LLM pour extraire et résumer les informations pertinentes des conversations. L'avantage est la simplicité d'intégration et le support entreprise. L'inconvénient est la perte potentielle d'information lors de la summarisation et un coût mensuel de 19 à 249 dollars.

Zep se spécialise dans le graphe de connaissances temporel hébergé en cloud. Sa force réside dans la compréhension des entités et de leurs relations dans le temps, ce qui en fait un outil puissant pour les workflows agentiques complexes. Le prix commence à 25 dollars par mois, et la version communautaire auto-hébergée offre des fonctionnalités réduites.

Hindsight, un projet open source, a obtenu 91,4 % sur LongMemEval et se distingue par son approche d'apprentissage à partir des sessions passées. Il est gratuit et local, mais son écosystème d'intégration est moins mature que celui de MemPalace.

La particularité de MemPalace est de combiner le meilleur des deux mondes : un fonctionnement entièrement local et gratuit avec un score de benchmark supérieur à toutes les alternatives payantes en mode raw. Le compromis est un setup initial plus technique et un écosystème encore jeune avec des bugs documentés.

Faut-il adopter MemPalace dès maintenant

MemPalace représente une avancée significative dans la mémoire persistante pour agents IA, avec un score de 96,6 % sur LongMemEval, un fonctionnement entièrement local, et un coût nul. L'architecture en palais de la mémoire apporte un gain de 34 % sur la précision de recherche par la seule organisation structurelle.

Le projet est cependant jeune, avec des problèmes de stabilité documentés et un marketing initial qui a dû être corrigé. La version 3.1.0 est utilisable en production pour des développeurs à l'aise avec Python et MCP, mais les équipes non techniques devront attendre des intégrations plus accessibles.

La tendance de fond est claire : la mémoire persistante devient un composant essentiel de l'infrastructure IA en entreprise. Avec la standardisation de MCP sous la Linux Foundation et la multiplication des agents autonomes, les outils comme MemPalace ne sont plus un luxe mais une nécessité. Le fait qu'un système gratuit et local rivalise avec des solutions payantes à plusieurs centaines de dollars par mois est un signal fort pour tout le marché.

Pour les équipes qui utilisent déjà des agents IA dans leur prospection ou leur développement, MemPalace vaut au minimum un test sur un projet pilote. Le coût d'entrée est nul, et le potentiel de gain en productivité est considérable.

logo emelia

Découvrez Emelia, votre outil de prospection tout en un.

logo emelia

Des prix clairs, transparents et sans frais cachés.

Aucun engagement, des prix pour vous aider à augmenter votre prospection.

Start

37€

/mois

Envoi d'emails illimités

Connecter 1 compte LinkedIn

Actions LinkedIn illimitées

Email Warmup inclus

Scraping illimité

Contacts illimités

Grow

Populaire
arrow-right
97€

/mois

Envoi d'emails illimités

Jusqu'à 5 comptes LinkedIn

Actions LinkedIn illimitées

Warmup illimité

Contacts illimités

1 intégration CRM

Scale

297€

/mois

Envoi d'emails illimités

Jusqu'à 20 comptes LinkedIn

Actions LinkedIn illimitées

Warmup illimité

Contacts illimités

Multi CRM Connexion

Unlimited API Calls

Crédits(optionnel)

Vous n'avez pas besoin de crédits si vous voulez simplement envoyer des emails ou faire des actions sur LinkedIn

Peuvent être utilisés pour :

Trouver Emails

Action IA

Trouver des Numéros

Vérifier des Emails

1 000
5 000
10 000
50 000
100 000
1 000 Emails trouvés
1 000 IA Actions
20 Numéros
4 000 Vérifications
19par mois

Découvrez d'autres articles qui pourraient vous intéresser !

Voir tous les articles
MathieuMathieu Co-founder
Lire la suite
NielsNiels Co-founder
Lire la suite
MathieuMathieu Co-founder
Lire la suite
MathieuMathieu Co-founder
Lire la suite
MathieuMathieu Co-founder
Lire la suite
MarieMarie Head Of Sales
Lire la suite
Made with ❤ for Growth Marketers by Growth Marketers
Copyright © 2026 Emelia All Rights Reserved