WorldRichnessAndDrive

约 2342 字大约 8 分钟

2026-06-05

一次与 Dolores 设计没有直接耦合的发散对话，临时沉淀下来。它不进项目的 invariants / scope，但里面有几条贯穿性的判断，值得留底。
起点是一个朴素的担心：当初顾虑"LLM 自带知识与记忆"会破坏沉浸，于是设想——能不能用游戏内的事件与历史，训练出一个"没有外部知识、却足够智能"的模型？

串起来的几个论点（逐层加码）

1. 一个村子的历史，能训出"无知识的智能"吗？——不能（在那个规模上）

把问题里捆着的三件事拆开：

沉浸 / 一致性（NPC 不穿帮、不会引用 iPhone）：可达。"在世界日志上做后训练 / 对齐"正是对路的手段，也正是当初"担心 LLM 自带知识"想解决的那个问题。
智能 / 推理力：造不出来，只能移植。当代 LLM 里智能与知识是同一块布——智能很大程度上就是被压缩的海量语料。抽掉语料 = 抽掉那块布本身。
接地性（概念指向村子而非我们的世界）：部分可达。

两个硬障碍：

数据规模：几百次迭代 ≈ 几百万到几千万 token；从零预训练要万亿级。只会得到一个"村庄本体论内流利、出村什么都不会"的窄模型（TinyStories 那条线的局限）。
污染悖论：游戏历史本身是由带外部知识的 LLM 生成的，知识被洗进剧情而非被去除。等于把外部知识洗一遍钱再喂回来。

能走通的现实配方：蒸馏 + RL——大模型当"推理的老师"，世界当"事实与价值观的老师"，几代蒸馏进小模型，再做记忆切除。

你想要的不是"无知识的智能"，而是"无泄漏的知识"。前者是悖论，后者是路线图。

2. 升级到成千上万 NPC、多年 MMO 呢？——天花板抬高，但有更深的坎

规模溶解了"量"的反对意见（万亿 token 不再是问题），但浮出两个规模治不好、反而放大的障碍：

模型坍缩（model collapse, Shumailov et al. 2024, Nature）：递归地在自己的产出上训练 → 分布的尾巴一代代消失、方差收缩、稀有事件被遗忘。而"让世界原生化"的那个动作（切掉外部喂养、只训自己的历史）恰恰就是触发坍缩的动作。跑得越久，熵漏得越多。
新熵从哪来：封闭世界的熵源只有 (a) 物理 / RNG 引擎（低维）、(b) 玩家、(c) 最初的 LLM 种子。目标要求切掉 (c)，于是熵源枯竭。

两条相反的路线（在设想里被捆在了一起）：

路线 A：蒸馏-切除——继续用外部 LLM 驱动，训世界原生模型，切外部记忆。规模化 → 撞坍缩，且永不脱离外部基底。再大也到不了目标。
路线 B：开放式从零 RL（环境当老师，不放 LLM 种子）——真能从无外部知识里长出能力。现实证据：
- AlphaZero / MuZero：零人类知识、纯自对弈、超人，但窄域。
- DeepMind XLand（Open-Ended Learning Leads to Generally Capable Agents）：在海量程序化任务空间里纯 RL，从零长出对没见过的任务零样本泛化的、域内通用的 agent。这是"环境规模 + 开放性 → 从零长出通用胜任力"目前最硬的证据。
抵消坍缩的力量：迭代学习的传递瓶颈（Kirby）——在有 reward 选择时，瓶颈反而把结构压缩出来（组合性语言就是这么自发涌现的）。Dolores 的确定性资源层 + 危机结局，正好提供这种选择压力。

（智能守恒）世界的丰富度，是它能孕育的智能的硬上限。 要长出跟地球锻造的心智一样聪明的模型，虚拟国度就得变得跟地球一样因果丰富、一样开放无界——到那一步它已经不是游戏，而是另一个现实；里面的模型会"恰好够聪明"，因为你榨不出比世界复杂度更多的智能。

3. "演员"问题：LLM 没有原初动力

当前所有 LLM 游戏，本质都是让 LLM 扮演——景区里的演员。问题不在意识，而在目标函数的归属：LLM 优化的是"像不像这个角色会说的话"（表演的可信度），而不是"我自己想要什么"。用 Searle 的话说，它有派生的意向性，没有原初的意向性。

演员表演饥饿，生物正在挨饿。 这一字之差，就是那股"怪"的全部来源——NPC 的追求其实是 prompt 作者的追求，被代为执行。

原初动力的开关不在知识量里，在回路里（"少知识"是搭车出现的，不是活性成分）：

封闭本体论——没有"外面"可供表演（世界原生模型自带这一点，杀死"演员的自觉"）；
有自身利害的闭环 + 在线更新——RL / 稳态驱动 / 主动推断（Friston 自由能、Schmidhuber 好奇心、empowerment）。给模型偏好状态 / 设定点，行动去维持，不维持就受罚，动力就从结构里长出来。

Dolores 已经铺好了基质（资源层、会死、危机有赌注），缺的一步是：现在是让 LLM 叙述"一个有赌注的角色"，而不是让策略对着赌注被优化。把死亡 / 资源结局反馈回策略 = 从"扮演挨饿"变成"正在挨饿"。

分层架构（村民 = 小的世界原生模型，主神 = 最强的真实世界模型）在多个维度上是对的：

知识的笼子就是角色的笼子：模型的知识广度映射本体层级。
主神 = 防坍缩的活熵源：它编排世界、生成新意、注入熵，正是封闭世界缺的那层"进气口 / 膜"。所以"最强的外部模型该待在神位上"不是矛盾。
铁律：主神改写世界，村民栖居世界。主神一旦开口替村民说话，村民立刻变回演员。 神的 agency surface 必须是环境 / 规则 / 危机 / 资源，绝不能是村民的嘴。
诚实的张力：最有原初动力的村民 ≠ 最有趣的村民。纯驱动的小模型可能蠢、嘴笨；妙趣横生的村民多半靠一点知识泄漏。这是一个设计旋钮：路人甲拧向"纯驱动"，关键 NPC 容许泄漏来换表现力。

4. LLM 有好奇心吗？——分三层

表演的好奇：有，而且很会（问澄清问题、"我很好奇……"、追有趣的点）。但同"演员"——派生而非原初。
作为驱动的好奇（技术义：Schmidhuber 压缩进步 / Pathak ICM / 主动推断的 epistemic value）：推理时没有。冻结的前向传播缺三样：在线更新、动作选择、对未知的扑取。
精确的不对称：LLM 的训练目标本身就是用"惊讶"铸的（交叉熵 = surprise）。但它只有"消除惊讶"的一半，没有"出门去找惊讶"的一半；它被动消除喂到面前的惊讶，不主动扑取。按 Schmidhuber，好奇的甜点在误差下降的导数上（可学习的未知才有趣）——而推理时的前向传播没有"自身学习速率"这个量，生不出"有趣"信号。

但好奇和饥饿一样，在回路里，不在参数里。 一条谱系，越往后越真：

表演的好奇（prompt 吩咐）→ 脚手架的好奇（loop 里它选了信息动作）→ 训练出来的好奇（内在奖励把"求新"刻进策略）。

村民的解药：要让村民活、有灵气地戳世界——不需要更大的脑，需要闭一条认知回路（世界原生小模型 + 对"村庄未知"的好奇奖励 + 能动手能观测）。至于它感不感到那种"想知道的痒"——那是硬问题，不替它吹；但功能缺口已经够清楚，足以回答实践问题。

好奇不是模型里的一个属性，而是你围着模型搭的一条回路——它和动力、和饥饿，是同一件事的三个名字。

贯穿全程的几条主线（TL;DR）

智能 ≈ 被压缩的环境规律；世界的丰富度是它能孕育智能的硬上限。
要的是"无泄漏的知识"，不是"无知识的智能"。
驱动力 / 好奇 / 饥饿都在回路里，不在参数里——是围着模型搭的反馈结构，不是模型自带的属性。
分层既是神学也是好工程：小的世界原生模型栖居世界（有真驱动），最强的外部模型坐神位编排世界（注入熵、防坍缩）；神动世界，民动自己——界限一破，驱动力就塌回表演。
张力未解：真驱动 vs 好表现，是一根设计滑杆，不是一个已解的问题。

研究锚点

Searle 派生 / 原初意向性 · Friston 自由能 / 主动推断 · Schmidhuber 好奇心 / 压缩进步 · Pathak ICM · empowerment · Shumailov model collapse · DeepMind XLand · AlphaZero / MuZero · Kirby 迭代学习 / 传递瓶颈 · TinyStories