Ep.1 - Le Golden Gate Bridge dans la tête de Claude

Maire, Kilian

doi:10.5281/zenodo.20523475

Published May 20, 2026 | Version v1

Working paper Open

Ep.1 - Le Golden Gate Bridge dans la tête de Claude

Maire, Kilian (Researcher)^{1, 2}

1. University of Copenhagen
2. Inserm

Premier épisode de la série « Histoires Naturelles des LLM ». L'article retrace l'expérience scientifique derrière la démonstration virale de mai 2024, où Anthropic a forcé l'amplification d'une feature interprétable dans Claude 3 Sonnet, le rendant temporairement obsédé par le Golden Gate Bridge. Sont expliqués le dictionary learning par sparse autoencoders, l'émergence d'unités de représentation lisibles dans les modèles de langage frontière, et le parallèle avec la découverte par Quian Quiroga (2005) des « neurones grand-mère » dans le lobe temporal humain. L'article situe l'interprétabilité mécanistique dans le contexte plus large d'une biologisation naissante des LLM, et discute des implications pour l'audit industriel et l'AI Act européen.

Files

Ep.1 - Le Golden Gate Bridge dans la tête de Claude.pdf

Files (392.4 kB)

Name	Size	Download all
Ep.1 - Le Golden Gate Bridge dans la tête de Claude.pdf md5:55e1a48901f85fefdf2a1562a5ab8497	392.4 kB	Preview Download

Additional details

Repository URL: https://substack.com/home/post/p-198593506

	All versions	This version
Views	8	8
Downloads	2	2
Data volume	1.2 MB	1.2 MB

Ep.1 - Le Golden Gate Bridge dans la tête de Claude

Authors/Creators

Description

Files

Ep.1 - Le Golden Gate Bridge dans la tête de Claude.pdf

Files (392.4 kB)

Additional details

Software