Published April 12, 2026 | Version 2.0
Preprint Open

構造持続と推論性能の劣化 — 論理一貫性維持の記述と最初の実験 —

Authors/Creators

Description

大規模言語モデルでは、対話が長くなるにつれて矛盾や未整理の更新が蓄積し、自己矛盾なく推論を完了することが難しくなることがある。本稿では、この劣化を「論理一貫性を保って最後まで到達できる推論経路の集合が、制約の蓄積によって縮小していく過程」として記述する。ここで扱うのは推論性能全般ではなく、与えられた前提や規則のもとで論理一貫性を維持できるかという、より限定された問題である。

 

対話実験では、外部代謝パイプラインを備えた条件(ON)が、備えない条件(OFF)に対して論理一貫性維持率を上回る方向が観測された。ここで ON とは、矛盾する更新を外部で検出し、「旧値 -> 新値」の時間ラベルつき対として整理・保持する条件である。OFF とは、同じ矛盾を注入するが、その整理を行わず、古い情報と新しい情報を未整理のまま混在させる条件である。gemma3:27b(n=3、ON/OFF/NC の三条件、180 ターン)では、規則+事実の合算で ON 73.3%、NC 56.7%、OFF 21.1% となった(ON vs OFF p = 0.0004, d = 8.80; ON vs NC p = 0.031, d = 2.67)。qwen3.5:27b(n=1、ON/OFF、30 ターン、§8.3 の実装前提を満たす条件、ON の代謝 LLM は Claude Sonnet)でも、全体正答率は ON 64.4%、OFF 44.4% となり、同じ方向が確認された。加えて、100ターンの長期実験(qwen3.5:9b、代謝あり条件)では、論理一貫性は長期にわたって安定し、単調な崩壊は観測されなかった。

Files

3_構造持続と推論性能の劣化.pdf

Files (305.5 kB)

Name Size Download all
md5:32a04de5988fd37af307a9b64ae10f43
305.5 kB Preview Download