外观
WorldRichnessAndDrive
约 2342 字大约 8 分钟
2026-06-05
一次与 Dolores 设计没有直接耦合的发散对话,临时沉淀下来。它不进项目的 invariants / scope,但里面有几条贯穿性的判断,值得留底。
起点是一个朴素的担心:当初顾虑"LLM 自带知识与记忆"会破坏沉浸,于是设想——能不能用游戏内的事件与历史,训练出一个"没有外部知识、却足够智能"的模型?
串起来的几个论点(逐层加码)
1. 一个村子的历史,能训出"无知识的智能"吗?——不能(在那个规模上)
把问题里捆着的三件事拆开:
- 沉浸 / 一致性(NPC 不穿帮、不会引用 iPhone):可达。"在世界日志上做后训练 / 对齐"正是对路的手段,也正是当初"担心 LLM 自带知识"想解决的那个问题。
- 智能 / 推理力:造不出来,只能移植。当代 LLM 里智能与知识是同一块布——智能很大程度上就是被压缩的海量语料。抽掉语料 = 抽掉那块布本身。
- 接地性(概念指向村子而非我们的世界):部分可达。
两个硬障碍:
- 数据规模:几百次迭代 ≈ 几百万到几千万 token;从零预训练要万亿级。只会得到一个"村庄本体论内流利、出村什么都不会"的窄模型(TinyStories 那条线的局限)。
- 污染悖论:游戏历史本身是由带外部知识的 LLM 生成的,知识被洗进剧情而非被去除。等于把外部知识洗一遍钱再喂回来。
能走通的现实配方:蒸馏 + RL——大模型当"推理的老师",世界当"事实与价值观的老师",几代蒸馏进小模型,再做记忆切除。
你想要的不是"无知识的智能",而是"无泄漏的知识"。前者是悖论,后者是路线图。
2. 升级到成千上万 NPC、多年 MMO 呢?——天花板抬高,但有更深的坎
规模溶解了"量"的反对意见(万亿 token 不再是问题),但浮出两个规模治不好、反而放大的障碍:
- 模型坍缩(model collapse, Shumailov et al. 2024, Nature):递归地在自己的产出上训练 → 分布的尾巴一代代消失、方差收缩、稀有事件被遗忘。而"让世界原生化"的那个动作(切掉外部喂养、只训自己的历史)恰恰就是触发坍缩的动作。跑得越久,熵漏得越多。
- 新熵从哪来:封闭世界的熵源只有 (a) 物理 / RNG 引擎(低维)、(b) 玩家、(c) 最初的 LLM 种子。目标要求切掉 (c),于是熵源枯竭。
两条相反的路线(在设想里被捆在了一起):
- 路线 A:蒸馏-切除——继续用外部 LLM 驱动,训世界原生模型,切外部记忆。规模化 → 撞坍缩,且永不脱离外部基底。再大也到不了目标。
- 路线 B:开放式从零 RL(环境当老师,不放 LLM 种子)——真能从无外部知识里长出能力。现实证据:
- AlphaZero / MuZero:零人类知识、纯自对弈、超人,但窄域。
- DeepMind XLand(Open-Ended Learning Leads to Generally Capable Agents):在海量程序化任务空间里纯 RL,从零长出对没见过的任务零样本泛化的、域内通用的 agent。这是"环境规模 + 开放性 → 从零长出通用胜任力"目前最硬的证据。
- 抵消坍缩的力量:迭代学习的传递瓶颈(Kirby)——在有 reward 选择时,瓶颈反而把结构压缩出来(组合性语言就是这么自发涌现的)。Dolores 的确定性资源层 + 危机结局,正好提供这种选择压力。
(智能守恒)世界的丰富度,是它能孕育的智能的硬上限。 要长出跟地球锻造的心智一样聪明的模型,虚拟国度就得变得跟地球一样因果丰富、一样开放无界——到那一步它已经不是游戏,而是另一个现实;里面的模型会"恰好够聪明",因为你榨不出比世界复杂度更多的智能。
3. "演员"问题:LLM 没有原初动力
当前所有 LLM 游戏,本质都是让 LLM 扮演——景区里的演员。问题不在意识,而在目标函数的归属:LLM 优化的是"像不像这个角色会说的话"(表演的可信度),而不是"我自己想要什么"。用 Searle 的话说,它有派生的意向性,没有原初的意向性。
演员表演饥饿,生物正在挨饿。 这一字之差,就是那股"怪"的全部来源——NPC 的追求其实是 prompt 作者的追求,被代为执行。
原初动力的开关不在知识量里,在回路里("少知识"是搭车出现的,不是活性成分):
- 封闭本体论——没有"外面"可供表演(世界原生模型自带这一点,杀死"演员的自觉");
- 有自身利害的闭环 + 在线更新——RL / 稳态驱动 / 主动推断(Friston 自由能、Schmidhuber 好奇心、empowerment)。给模型偏好状态 / 设定点,行动去维持,不维持就受罚,动力就从结构里长出来。
Dolores 已经铺好了基质(资源层、会死、危机有赌注),缺的一步是:现在是让 LLM 叙述"一个有赌注的角色",而不是让策略对着赌注被优化。把死亡 / 资源结局反馈回策略 = 从"扮演挨饿"变成"正在挨饿"。
分层架构(村民 = 小的世界原生模型,主神 = 最强的真实世界模型)在多个维度上是对的:
- 知识的笼子就是角色的笼子:模型的知识广度映射本体层级。
- 主神 = 防坍缩的活熵源:它编排世界、生成新意、注入熵,正是封闭世界缺的那层"进气口 / 膜"。所以"最强的外部模型该待在神位上"不是矛盾。
- 铁律:主神改写世界,村民栖居世界。主神一旦开口替村民说话,村民立刻变回演员。 神的 agency surface 必须是环境 / 规则 / 危机 / 资源,绝不能是村民的嘴。
- 诚实的张力:最有原初动力的村民 ≠ 最有趣的村民。纯驱动的小模型可能蠢、嘴笨;妙趣横生的村民多半靠一点知识泄漏。这是一个设计旋钮:路人甲拧向"纯驱动",关键 NPC 容许泄漏来换表现力。
4. LLM 有好奇心吗?——分三层
- 表演的好奇:有,而且很会(问澄清问题、"我很好奇……"、追有趣的点)。但同"演员"——派生而非原初。
- 作为驱动的好奇(技术义:Schmidhuber 压缩进步 / Pathak ICM / 主动推断的 epistemic value):推理时没有。冻结的前向传播缺三样:在线更新、动作选择、对未知的扑取。
- 精确的不对称:LLM 的训练目标本身就是用"惊讶"铸的(交叉熵 = surprise)。但它只有"消除惊讶"的一半,没有"出门去找惊讶"的一半;它被动消除喂到面前的惊讶,不主动扑取。按 Schmidhuber,好奇的甜点在误差下降的导数上(可学习的未知才有趣)——而推理时的前向传播没有"自身学习速率"这个量,生不出"有趣"信号。
但好奇和饥饿一样,在回路里,不在参数里。 一条谱系,越往后越真:
表演的好奇(prompt 吩咐)→ 脚手架的好奇(loop 里它选了信息动作)→ 训练出来的好奇(内在奖励把"求新"刻进策略)。
村民的解药:要让村民活、有灵气地戳世界——不需要更大的脑,需要闭一条认知回路(世界原生小模型 + 对"村庄未知"的好奇奖励 + 能动手能观测)。至于它感不感到那种"想知道的痒"——那是硬问题,不替它吹;但功能缺口已经够清楚,足以回答实践问题。
好奇不是模型里的一个属性,而是你围着模型搭的一条回路——它和动力、和饥饿,是同一件事的三个名字。
贯穿全程的几条主线(TL;DR)
- 智能 ≈ 被压缩的环境规律;世界的丰富度是它能孕育智能的硬上限。
- 要的是"无泄漏的知识",不是"无知识的智能"。
- 驱动力 / 好奇 / 饥饿都在回路里,不在参数里——是围着模型搭的反馈结构,不是模型自带的属性。
- 分层既是神学也是好工程:小的世界原生模型栖居世界(有真驱动),最强的外部模型坐神位编排世界(注入熵、防坍缩);神动世界,民动自己——界限一破,驱动力就塌回表演。
- 张力未解:真驱动 vs 好表现,是一根设计滑杆,不是一个已解的问题。
研究锚点
Searle 派生 / 原初意向性 · Friston 自由能 / 主动推断 · Schmidhuber 好奇心 / 压缩进步 · Pathak ICM · empowerment · Shumailov model collapse · DeepMind XLand · AlphaZero / MuZero · Kirby 迭代学习 / 传递瓶颈 · TinyStories
