Yuda Bi
  • About
  • Publications
  • Projects
  • Notes
  • 小说 Novels

第十章:基线

《漫长的求证》第十章《基线》:第一次组会,被一句”What’s your baseline?“拦在半空。Kevin 抽屉里露出半截写着 Phase Transitions 的旧本子。

《漫长的求证》 · 第二部「隧」

第十章:基线

Knowing what you’re looking at is expensive.

陆沉进入Whitmore实验室后的第一周,先认识的不是人,是桌子。

靠窗那排桌子大多旧,木皮边缘翘起一点,手肘压久了会硌出一道细印。Whitmore给他的是最靠门的一张,旁边插座有点松,充电器插头要往左偏一点才接得稳。桌上除了一盏台灯,什么都没有。陆沉把电脑放上去,又把笔记本摊开,桌面还是显得空。空得像一块新分出来的地,暂时还没有长东西。

真正有存在感的是对面的工位。

那张桌子上有两块显示器,别人的桌子都只有一块。左边那块屏幕开着代码,右边那块是LinkedIn页面,头像照干净得像广告。姓名下面一串学校和标签,最显眼的是 Stanford。桌上放着一个白色咖啡杯,杯身印着红色的校徽,杯沿有一点浅褐色的咖啡圈。键盘旁边压着会议胸牌,带子还没摘,像刚从什么会场回来不久。再往上看,桌边那块小白板上密密麻麻写着一串attention mechanism的推导,最后一行画了一个很利落的对号。

这张桌子不需要主人坐在那儿,已经先把主人说明白了一半。

陆沉坐下没多久,门就被推开了。

进来的是个华裔男生,个子比他高一点,穿灰色连帽衫,手里拎着两杯外带咖啡,肩上背着电脑包。他一进门就先把其中一杯搁到Whitmore办公室门口,像这件事已经做惯了。然后他回身看见陆沉,愣了一下,很快笑起来。

“You must be Lu.”

“Yes.”

“Kevin.”他把空出来那只手伸过来,握手很快,掌心干净,没有装熟的热络,也没有刻意的距离。“Welcome to the museum.”

陆沉没反应过来:“Museum?”

Kevin朝周围看了眼,耸了耸肩:“Old papers, old equations, old coffee. You’ll see.”

他说这话的时候并不刻薄,反倒像在说一个自己也待惯了的地方。说完,他把电脑包放到自己的椅子上,点亮屏幕。LinkedIn页面跳回桌面,露出几排终端窗口和一篇还没关掉的论文PDF。论文标题里有 foundation models,副标题写着 time-series forecasting。

陆沉注意到,他桌上那只Stanford咖啡杯边上还压着一张便利贴,上面写着一串待办:NeurIPS rebuttal,advisor meeting,LinkedIn update,mom call。最后一项后面还画了个方框,没勾。

Kevin顺手把另一杯咖啡推给陆沉:“Whitmore说你不喝太甜的,我就没加糖。”

“谢谢。”

“别谢太早。”Kevin坐下来,手已经放到键盘上,“这里的咖啡一般都煮过头。”

他说完敲了几下键盘,机械轴发出很清脆的响。白板上的公式、杯沿的咖啡圈、屏幕上切来切去的窗口,都让人感觉他在这里不是”学习”,而是在高效地使用一整套已经长进身体里的工具。

这就是实验室的生态。

Whitmore 这边走老路,根扎得深,方向不挪。Kevin 那边走的是另一种节奏,事情多,节奏快,每天的待办列得很满。剩下的人零零散散在两端之间。有个做非平衡系统的博士后,电脑贴纸贴满了半个机身,开会时总把头发挽到耳后;还有个联合培养的学生,工位上长期放着一袋开封的米饼,写代码时爱把脚搭在椅梁上。大家都不坏,也都很忙。多数时候,他们各自做各自的事,到组会前才会真正坐到一张桌子边来。

Whitmore的带人方式也很旧。

他没有给陆沉做什么正式介绍,更没有那种”欢迎加入我们大家庭”的话。第二天上午,他只是从办公室里探出半个身子,把三篇打印论文放到陆沉桌上。最上面那篇边角已经发黄,题目里有 disorder 和 phase transition。Whitmore 用手指点了点那几页纸,说:“Read these. Then tell me which assumption you don’t believe.” 说完就回去了,连停都没停。

陆沉看着那三篇论文,有一瞬想笑。

不是因为轻松。是因为这种考法已经很久没人用了。别人要的多半是结果,是表格,是可以塞进申请材料里的那种明确进度。Whitmore 要的却是你先学会不信——对一篇已经发表、已经被很多人接受的东西,低头看久一点,看出哪一行偷偷替世界做了简化。

那三篇陆沉读了整整一周。

第一篇是 1971 年的,作者陆沉听过;第二篇是 1989 年的,作者他没听过,但摘要里有一段引用了第一篇;第三篇是 2003 年的,作者是一个还在世的德国教授,文章里直接挑战前两篇的核心假设。三篇放在一起,像一段没人替你串好的对话。陆沉把三篇按时间顺序铺在桌上,第二篇和第三篇中间留了一指宽的空隙——他自己不知道这一段中间发生了什么,可他知道这段空隙正是 Whitmore 想让他看见的。

第三天傍晚,他在第二篇那一段关于尺度变换的论证下面画了一道铅笔线。这一段他读不通。他试着问 Yong——Kevin 不在——Yong 看了一眼摇了摇头:“I don’t do this stuff.”陆沉自己又看了一晚上,到第二天早上,他在那条铅笔线旁边写了一行小字:“assumption: scale invariance survives discretization. Why?”

第七天,他敲了 Whitmore 办公室的门。

Whitmore 让他坐下。陆沉先没说自己读懂了什么——他先把那一行铅笔字念了出来。

Whitmore 听完,把眼镜推上去看他。

“Good question.” 他说,“你来找我之前,先去图书馆找一篇 1976 年的 Wilson 综述。读到第三章。读完再回来。”

陆沉点头,没问 Wilson 是谁——他已经知道。


那三篇之后,Whitmore 给他开了一个 reading list。

list 不是邮件发的——是 Whitmore 在一张废纸上手写的。十二条文献,每一条只有作者姓+年份,没有标题。陆沉拿到那张纸的时候,纸边已经被 Whitmore 用钢笔点了几个小黑点——他在自己脑子里数过这十二条,一条一条点过去。陆沉把这张纸折好,夹进笔记本第一页。后来这张纸他一直留着——不是因为它珍贵,是因为这是他来美国以后,第一次有人不在乎他的本科出身,只在乎他能不能读懂 Wilson。

那一周陆沉早上六点起,晚上十一点回。第三天下午他在茶水间撞见 Kevin。Kevin 看见他眼下的青,笑了一下。

“What’s he giving you to read?”

陆沉报了一个名字。Kevin 嗯了一声:“Yeah. He gave me that one too.”

“You finished it?”

Kevin 把咖啡杯举起来碰了一下陆沉的杯子:“I tried. 跳了三章。”

陆沉没追问 Kevin 跳了哪三章。他知道他自己不会跳。

Kevin在这种时候通常会从另一条轨道上伸手过来。

陆沉第一次登录实验室集群的时候,账号权限一直报错。他对着终端看了十分钟,还没搞明白是学校VPN的问题,还是服务器目录没配对。Kevin从旁边经过,扫了一眼屏幕,把自己的咖啡放下,弯腰在键盘上敲了几行命令。

“你少了个组权限。”他说,“Whitmore大概忘记点了。”

说完又直起身,像忽然想起这话会不会显得像在背后说导师坏话,于是补了一句:“He forgets practical things when he gets excited.”

终端界面一刷新,目录树就出来了。陆沉说谢谢。Kevin摆了摆手,回自己桌前前又丢下一句:“Museum needs adapters. Otherwise nothing connects.”

那天中午,两个人在茶水间又碰见一次。微波炉里转着Kevin前一天打包的墨西哥卷,塑料盖子被蒸汽顶得微微鼓起来。Kevin盯着转盘看了几秒,忽然问陆沉:“你是真的不想做predictive models,还是你现在还不会?”

问题问得很直。

陆沉想了想,说:“都会一点。但我更想先知道自己在看什么。”

Kevin听完,没反驳,只把微波炉门打开,热气一下冒出来。他端着盘子往外走时,像随口又像认真地说了一句:“Knowing what you’re looking at is expensive.”

Whitmore每周五下午开组会。

开会前一小时,实验室会出现一种很特别的安静。不是没人,而是每个人都在给自己的东西补最后那几笔。Kevin会把屏幕上没跑完的训练日志先最小化,再打开一份排版干净的幻灯片;博士后会在白板边站一会儿,确认公式顺序;Whitmore则会拿着那本黑色硬壳笔记本,提前坐进会议室,翻上一周的记录。陆沉来的第三周,就轮到他做第一次正式汇报。

那几天他准备得很慢。

不是因为内容多,而是因为一开始他就不想按别人习惯的方式讲。他的初步想法很简单:不用端到端模型预测价格,而是用谱分解的方法提取市场中的集体行为模式,先搞清楚系统在发生什么,再谈它会不会往哪里去。这个想法写成句子不长,做成汇报却很难。因为一套方法没有数字、没有对照、没有标准排行榜上的位置,在现在这种会场里几乎说不出口——大家想看的就是那几行数字。

周五下午四点,会议室投影一亮,陆沉就知道自己躲不过这个问题。

会议室不大。百叶窗拉了一半,外面的天色像一张没洗干净的灰布。投影仪挂在头顶,风扇一直转,发出持续的低响。桌上放着一盒没人动过的甜甜圈,糖霜在纸盒边缘掉了一层。Kevin坐在靠后的位置,笔记本开着一半,手里转着一支黑色签字笔。Whitmore坐在最前面,黑色硬壳本摊开,笔横在纸上,还没写字。

陆沉站到屏幕前,把第一张slide投出来。

标题很朴素,连个副标题都没有。第二张是数据和问题设置。讲到第三张时,他把自己的想法说了出来:“I want to use spectral decomposition to identify collective modes in the market, instead of treating the whole thing as an end-to-end prediction task.”

话音刚落,左边一位博士后就抬起头。

“What’s your baseline?”

问题来得非常快,像球还没落地就被人在半空里拦住。陆沉看过去。那博士后戴细框眼镜,手里还转着笔,语气不凶,甚至算得上公事公办。正因为公事公办,才更难躲。

“I don’t have one yet,”陆沉说。

会议室里静了一秒。

他知道这还不够,于是又补了一句:

“Because I’m not sure this is a prediction problem.”

全场安静下来。

投影仪风扇的声音一下子变得很大。Kevin手里的笔停住了。有人把椅子往后挪了一点,椅脚在地上擦出一声轻响。Whitmore没有抬头,也没有替他说话。他只是在笔记本上写了一个什么词,然后把本子合上了。

陆沉站在屏幕前,能感觉到空气里那种很细的尴尬。

不是敌意。

是这间会议室一向沿着一种轨道往前讨论,他这一句话临时把别人脚下熟悉的那块板抽走了一秒。

那一刻他忽然想起多年前黎知秋在图书馆桌对面,把一道题写完抬头,问他:“你看的不是答案,对吧?”——那时她说他”不在同一个量子数上”。这间会议室里没有这样的人。

他后面还是把汇报讲完了。

讲得不算顺。有两页解释得过快,一页图太丑,另一页公式又写得太密。中途博士后追问过两次,Kevin 也问了一句窗口怎么选。Whitmore 全程没怎么说话,只在最后收拾笔记本时留下一句:“Next week, show me what survives after you remove the obvious mode.”

这话不是肯定,也不是否定,是叫他下周再看一次同一块东西。

散会以后,人很快走了一半。

甜甜圈还是没怎么动。有人把投影关掉,房间一下暗下来一点。陆沉把电脑合上,正要收电源线,Kevin从后排走过来,手里还拿着那支黑色签字笔。

“Shen,”他说。

陆沉抬头看他。Kevin像是没意识到自己把”Chen”叫得有点偏,也可能早就习惯别人懒得纠正这种小偏差。他站在桌边,语气很平:“Can I give you a suggestion?”

“可以。”

“先跑一个baseline。”Kevin 说,“哪怕是最简单的。ARIMA 也好,LSTM 也好,哪怕就一个 moving average。拿到一些数字,这样你至少有东西可以讲。不然教授们会觉得你在空谈。”

他说这句话的时候没有居高临下,也没有”我来教你做人”的味道。更像在这种会议室里待久了的人,顺手提醒一句不至于第一回合就被推出去。

陆沉把电源线绕在手上,停了一下。

“如果我先跑baseline,”他说,“我就已经接受了这是一个预测问题。”

Kevin看着他,没马上接。

会议室门开着,外面有人经过,说笑声浮进来一点,很快又远了。桌上甜甜圈盒子边缘的糖霜被空调风吹得掉下来一粒,落在纸盒折缝里。Kevin把笔在指间转了一圈,才问:

“Then what is it?”

陆沉说:“一个理解问题。”

Kevin沉默了。

不是被说服的沉默,也不是不耐烦。他像被这句话扣了一下——他大约听懂这句话什么意思,只是已经很久不那样生活了。然后他抬手,在陆沉肩上拍了一下。

那个动作很真诚。

真诚得反而让人更难受。因为陆沉知道,Kevin 的建议在今天这间会议室里是完全对的——在现在这个评价体系里,它就是最稳妥的那条路。

“I get it,”Kevin说,“I just don’t think the room will.”

说完这句,他像想起什么,转身去自己工位上翻抽屉。

抽屉拉开时碰到桌腿,发出一声轻响。最上面放着几个转接头、一叠会议名片和一块没拆封的能量棒。Kevin在里面找U盘,翻到一半,一本旧笔记本露了出来。封面发黄,边角卷起,上面用黑色马克笔写着两个词:Phase Transitions。

陆沉的视线停了一下。

Kevin顺着他的目光看见那本笔记,笑了笑。

“Undergrad stuff,”他说,“本科时候的东西。”

他把U盘找出来,又顺手把那本笔记往里面推了一点。

“后来发现这个方向太慢了。”

这句话说得很轻,没有自嘲,也没有遗憾。陆沉还是听出来里面那点几乎听不见的停顿——不是后悔,更接近一种”早已经收好”的克制。

Kevin 把 U 盘插进电脑,屏幕亮了一下。

桌上的 Stanford 咖啡杯边缘还留着早上那圈浅褐色的印。白板上的 attention 推导最后那个对号黑得发亮。LinkedIn 页面已经关掉了,换成训练日志和会议日程。Kevin 在键盘上敲了几下,屏幕跳到一份 NeurIPS 的 rebuttal 模板。他抬手把袖口推上去一点,开始往里面填字。

陆沉站在一旁,看着那本只露出一截边角的 Phase Transitions 笔记,没有再说话。

窗外天快黑了。实验楼走廊的灯一盏一盏亮起来,白得很均匀。会议室那边有人关门,传来一声不轻不重的闷响。Kevin低头继续敲键盘,动作很快,像一切都已经回到原来的轨道。

陆沉把电脑抱起来,转身往自己那张空桌走。

桌面上还摊着他刚才汇报时用过的笔记。最上面一页只写了一个词:baseline。旁边什么都没有。


那天晚上他回到公寓,没有立刻打开电脑。

他站在厨房水槽前洗了一只用了三天没洗的杯子。杯壁上的咖啡渍泡了一会儿,用海绵擦才慢慢淡下去。洗完以后他把杯子搁到沥水架上。屋里只有冰箱压缩机一下一下的低响。

他打开冰箱,里头还剩半盒鸡蛋和一袋打折番茄。

那一瞬他想起 Kevin 拍他肩膀时那种诚恳——不是装的诚恳,是真的诚恳。这种诚恳让他更难。如果 Kevin 是恶意的,他可以站住自己的位置;可 Kevin 是对的——在现在这个体系里,他的建议就是最稳的那条路。

陆沉站在冰箱前没动。冷气从下面慢慢漫到他脚踝。过了一会儿他把冰箱关了。他没有煮饭,也没有找其他事做,就这么坐到桌前,把那本笔记翻开,在 baseline 那个词下面慢慢写下三个字:

not yet.

他把笔放下。窗外街灯一盏一盏亮着,落在公寓地板上是均匀的橘色。陆沉靠到椅背上,看着天花板看了一会儿。第二天早上他要回到那张空桌前,重新开始。可这一晚先这样过。

← 上一章:旷野中的灯 下一章:暗物质 →

 

Yuda Bi  |  Built with Quarto