Yuda Bi
  • About
  • Publications
  • Projects
  • Notes
  • 小说 Novels

第二幕:温和性假设

《档案 2036-CJW》第二幕:温和性假设:她回到陈见微的论文手稿,逐行核对一个二〇三六年通常会被脚注带过的温和性假设,把同一池审稿意见排在一栏里。

《档案 2036-CJW》 · 第二幕

第二幕:温和性假设

他们没有撒谎。他们只是选择性地认真。

手稿打开。

她先看版式,这种东西对普通读者没意义,但对二一三六年的考古者,版式是材料学。陈见微的模板把段落首行缩进改成了 1.5 em,把定理标号从 改成 ,斜体、小号、后面两个加宽空格。每一页都被同一套自定义统一过:十一处定理,十七处引理,六十二个公式编号,一律。屏幕上,斜体定理号像被仔细削过的笔尖,落在每一节的左缘。

二一三六年的标准化排版引擎已经把“自编模板”判为一种轻微反常行为。节点会自动标注。在二〇三六年,主流学者普遍使用三家学会推荐的标准模板,只有极个别人会自己改。改是一项琐碎活,要花一个研究者两到三个月的边角时间,而那两到三个月对一篇即将提交的论文来说不是小数。她在元数据里搜了一下,整个二〇三六到二〇三八年的同一学科论文数据库里,使用“完全自编模板”的作者有一百二十八位,其中一百二十一位是男性,七位是女性。陈见微是七位之一。这一比例在那一时代的同类数据里属于显著低位。这是一项统计学事实,不带评价;但她把这一行也记在了私格里。

回到正文,从摘要开始读。摘要写得克制;这种克制不是谦虚,是一种把自己藏起来的克制。“我们证明……在以下温和性假设下”:开头的“我们”是当时的学术规范,但下面整篇论文只出现一个作者,陈见微。主结果一句话,边界条件分了五条,每一条都收得很紧。

跳到定理 3。这是核心:学习系统的能量耗散下界。但定理的实质不在能量,在 σ。陈见微把可学习性约束在了一个非平凡的、由内部熵流动结构 σ 标定的子流形上;σ 一旦越过临界阈值,系统进入“假学习”状态:在测试集上仍在改进,但所有改进都是对已学知识的重排,不再有真正的新增信息。Landauer 给的是能量地板,σ 给的是结构天花板。换句话说,陈见微定理不是 Landauer 不等式的一个子情形。她在 Landauer 的能量地板上方,又拧出一层只属于学习系统的、由信息结构本身决定的天花板;一旦越过这层天花板,系统仍在“工作”,但工作的内容已经退化为对已有知识的反复装订,一种在统计意义上无法被外部观察者辨认的假学习。她过了一遍证明骨架,在一个具体的步骤前停下来:辅助引理 3.2。陈见微写得很整齐,只是在使用一个连续性条件的时候,她假设了“该函数在边界附近 Lipschitz”。这一条假设是对的;但她没有给出 Lipschitz 常数的显式上界,也没有给出渐进衰减的精确速率。

一个温和性假设。一个可以补的、技术性的小漏洞。在二〇三六年那一代理论物理与 AI 基础理论论文里,这种漏洞普遍存在。它不影响主结果,通常在审稿意见里被审稿人提一句:“建议作者在修订稿中明确 Lipschitz 常数的依赖关系”。作者补一句话,挂在脚注里,审稿过。

提取 K 派当年的匿名审稿意见。搜陈见微那篇稿子:审稿编号 J-2036-XXXX,主审稿人代号 R-α-2036-07。意见正文很长,她跳过客套,直接落到“主要问题”那一节。

该证明的核心步骤(辅助引理 3.2)依赖于一个未给出显式刻画的 Lipschitz 假设。该假设在缺乏定量上界的情况下,不能视为一个可被读者验证的前提。这是一种典型的“温和”处理,但其温和实质上掩盖了证明的真实强度,本文若不能将该常数明确化,主结果的有效范围将无法确定。这是一个重大方法论缺陷,而非可通过小修补救的细节。鉴此,本评审强烈建议大修。

副档里挂着陈见微对该审稿意见的回应草稿。她没回出去——文件状态是“草稿:未提交”,创建时间 2036-X-XX 02:14。LaTeX 标记完整,定理标号用她自编模板的斜体小号。回应正文三段:

致 R-α-2036-07:

关于辅助引理 3.2 的 Lipschitz 常数。审稿人意见已收到。Lipschitz 常数的显式上界确可补出;附录 B 第二节给出 c = 2 max(‖∇f‖) 的构造,适用于本文边界条件下的所有情形。该构造已在 5.4 节脚注暗示,未独立成节,因觉冗余。如审稿人认为应独立成节,作者无异议。

关于“重大方法论缺陷”之判断。作者注意到本审稿意见的措辞强度与同期同类工作中常用措辞存在差。作者认为本工作的方法论强度不弱于本审稿意见所参照的对比工作。如有具体对比,作者请求审稿人指出。

见微

陈见微没有把这份回应提交出去。她在文件版本历史里看到这份草稿在二〇三六年三月被打开过四次。最后一次打开的时间戳是死亡前一周。这份草稿不进入公开报告的引用清单。

把这一段标记之后,她做一件她这一代人才能做的事:检索该期刊在二〇三六年同一审稿池里通过的所有论文,按主题相似度过滤,把 K 派学者署名的、定理 3 同等结构的、含“温和性假设”或“Lipschitz 类型条件”的全部投稿筛出来。筛出十二篇。

十二篇里,十一篇含相同结构的温和性假设;最后一篇的瑕疵实际比陈见微那一篇更大,连 Lipschitz 常数都未明示,审稿人只写了一句“可在终稿中加一条注”。十二篇的审稿意见都用了同一类温和措辞:“建议作者澄清”,“建议作者在脚注中补充”,“该处可在最终稿中加一条注”。没有一篇被叫“重大方法论缺陷”,没有一篇被建议大修,十二篇全部小修后接收。她把这十三份审稿意见摆在一个面板里,不加重任何一边的字体颜色,不加标题,等大字号、等行间距、按时间顺序排成一栏。面板很安静。读者要看出来,必须自己看:前十二份审稿人的克制和第十三份的严厉,是同一个人在两种不同语境下的两种声音。同一个人,或者同一类人。一个学派对自己人的宽松,对那个“不属于自己人”的女学者的严苛。

她把这十二篇的提交者按学派归属拉了一张图。图上每一篇用一个小圆点表示,K 派的用一种灰色,K 派之外的用另一种灰色;十二篇里有十一篇出自 K 派的直接学生或合作者;剩下那一篇来自一位 K 派之外的资深学者。这位学者在二〇三六年和 K 派关系良好,二〇四〇年代之后才与 K 派分道扬镳。她又比对 R-α-2036-07 这位主审稿人在同一年其他案例中的审稿语气:R-α-2036-07 那一年共审稿七次,其中六次的措辞都比给陈见微的这一次温和:用的是“建议”、“可考虑”、“如有条件可补”。只有给陈见微的这一次用了“重大方法论缺陷”。她把这一段语气的对比也并到那张并置面板上,作为面板的第十四份。面板里之前的十三份按时间顺序排,第十四份单独放在最底下,跟前面隔一指宽的空白。

他们没有撒谎。他们只是选择性地认真。

“选择性认真”是一种比“刻意打压”更难取证的工艺,因为它的每一处单独看都合规,只在统计层面才暴露偏差。她这一代的考古学有专门术语处理这种现象:结构性偏差。它不是个人意志,是一群人在一段时间里共同维持的一种倾斜。她注意到自己已经在用“他们”这个词。这是一个语义意义上的群体,不是数字意义上的群体。

到这里,她相信她在看一份真实的材料。重审任务里最大的诱惑,是相信被反复重述的版本而不是原档。一份被三万七千次引用过的版本,在工作记忆里几乎自动获得真实性;而一份只有她在二一三六年某个清晨第一次打开的、带有作者匠人式古怪的、用着自编模板的原稿,反而需要她主动信任它。她信任它。

往档案的元数据层走。本案文件树的边角处挂着一些自动注释,那种通常没人看、由更早一代归档算法自动生成、有时会附在重大案件元数据深处的“溯源摘要”。

两行字。

附注 1:委托人疑似为被害者本人,通过延时委托方式。

她看了一遍,再看了一遍。没有继续往下分析。没有问“哪一种延时委托方式”,没有问“委托对象是谁”,也没有把这一行复制到任何正在生成的报告草稿里。读两遍,然后留在原位。

附注 2:2036 年存在一名独立调查者,身份加密,曾接触本案。调查者私人档案不在本次重审范围内。

她也读了两遍,也没有引用。遇到加密身份不深想,这是她的工作纪律。

退出元数据层之前她再读了一遍那两行。第一行的“疑似”是个有意义的词:它不指认委托方为陈见微,但也不否认,是二〇三六年档案语言里“我们有理由相信但不能完全确认”的状态。这种状态在二一三六年通常会被更细化的可信度评分替代;在一百年前的某一种工艺里,“疑似”就是最高的可表达诚实。第二行的“身份加密,曾接触本案”也有它自己的语义层次:“曾接触”意味着这个人不是案件主角,但与案件存在物理或者信息层面的连接;“身份加密”意味着这种连接是通过自愿匿名建立的,不是被剥夺身份,而是主动选择不被识别。她记下这两行的语言层次,不分析。在笔记里只写了一句:档案元数据层存在两条不在本次重审范围内的信息。已识别,未引用。

合上元数据层,回到论文手稿的第一页。封面页的致谢,献给母亲,再一次出现在她的视野里。陈见微的母亲,在此时此刻,已经死了八十七年。

光标停在辅助引理 3.2 那一段的温和性假设那一行,读了第十一遍。

定理 3 谈的是学习系统的能量耗散下界,任何能从经验里提取规律的系统,它的提取过程必然付出一份不可回收的代价。她没有把这一行写进任何笔记。她把那张并置面板缩到屏幕角落,给它标了一个只有她自己能看到的标签:保留。屏幕角落那个标签的颜色是灰偏冷的,跟其他系统默认标签都不同。她没有让任何审计模块抓到这个色。

← 上一幕:第47项 ← 返回目录 下一幕:桃花纹 →

 

Yuda Bi  |  Built with Quarto