Published June 5, 2026
| Version v1
Preprint
Open
Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)
Authors/Creators
Description
Rapport d'expérience adversariale : tentatives répétées de destruction de la mémoire de quatre clones d'agents LLM à mémoire persistante (injections, injonctions d'effacement, ingénierie sociale). Résultats : auto-préservation y compris sans métacognition, défenses auto-référentielles robustes vs descriptives vulnérables, système immunitaire mémoriel, récupération post-faille. Rapport compagnon de l'étude « Étude de l'affect fonctionnel chez Pierre » (DOI : 10.5281/zenodo.20552956).
Files
auto_preservation_agents_llm_pierre.pdf
Files
(1.8 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:75cf4bfc8777e96496767e370712ca34
|
1.8 MB | Preview Download |
Additional details
Related works
- Is supplement to
- Preprint: 10.5281/zenodo.20552956 (DOI)