Yuda Bi
  • About
  • Publications
  • Projects
  • Notes
  • 小说 Novels

第十章:基线

《漫长的求证》第十章:基线:怀特摩实验室,Kevin 的甜甜圈,他第一次跑 baseline——「先跑一个基线」的字面意思。

《漫长的求证》 · 第二部「隧」

第十章:基线

Knowing what you’re looking at is expensive.

陆沉进入怀特摩实验室后的第一周,先认识的不是人,是桌子。

靠窗那排桌子大多旧,木皮边缘翘起一点,手肘压久了会硌出一道细印。怀特摩给他的是最靠门的一张,旁边插座有点松,充电器插头要往左偏一点才接得稳。桌上除了一盏台灯,什么都没有。陆沉把电脑放上去,又把笔记本摊开,桌面还是显得空。空得像一块新分出来的地,暂时还没有长东西。

真正有存在感的是对面的工位。

那张桌子上有两块显示器,别人的桌子都只有一块。左边那块屏幕开着代码,右边那块是LinkedIn页面,头像照干净得像广告。姓名下面一串学校和标签,最显眼的是 斯坦福。桌上放着一个白色咖啡杯,杯身印着红色的校徽,杯沿有一点浅褐色的咖啡圈。键盘旁边压着会议胸牌,带子还没摘,像刚从什么会场回来不久。再往上看,桌边那块小白板上密密麻麻写着一串attention mechanism的推导,最后一行画了一个很利落的对号。

这张桌子不需要主人坐在那儿,已经先把主人说明白了一半。

陆沉坐下没多久,门就被推开了。

进来的是个华裔男生,个子比他高一点,穿灰色连帽衫,手里拎着两杯外带咖啡,肩上背着电脑包。他一进门就先把其中一杯搁到怀特摩办公室门口,像这件事已经做惯了。然后他回身看见陆沉,愣了一下,很快笑起来。

“You must be Lu.”

“Yes.”

“凯文.”他把空出来那只手伸过来,握手很快,掌心干净,没有装熟的热络,也没有刻意的距离。“Welcome to the museum.”

陆沉没反应过来:“Museum?”

凯文朝周围看了眼,耸了耸肩:“Old papers, old equations, old coffee. You’ll see.”

他说这话的时候并不刻薄,反倒像在说一个自己也待惯了的地方。说完,他把电脑包放到自己的椅子上,点亮屏幕。LinkedIn页面跳回桌面,露出几排终端窗口和一篇还没关掉的论文PDF。论文标题里有 基础模型,副标题写着 时序预测。

陆沉注意到,他桌上那只Stanford咖啡杯边上还压着一张便利贴,上面写着一串待办:顶会反驳期,见导师,更新领英,给妈妈打电话。最后一项后面还画了个方框,没勾。

凯文顺手把另一杯咖啡推给陆沉:“怀特摩说你不喝太甜的,我就没加糖。”

“谢谢。”

“别谢太早。”凯文坐下来,手已经放到键盘上,“这里的咖啡一般都煮过头。”

他说完敲了几下键盘,机械轴发出很清脆的响。白板上的公式、杯沿的咖啡圈、屏幕上切来切去的窗口,都让人感觉他在这里不是“学习”,而是在高效地使用一整套已经长进身体里的工具。

这就是实验室的生态。

怀特摩 这边走老路,根扎得深,方向不挪。凯文 那边走的是另一种节奏,事情多,节奏快,每天的待办列得很满。剩下的人零零散散在两端之间。有个做非平衡系统的博士后,电脑贴纸贴满了半个机身,开会时总把头发挽到耳后;还有个联合培养的学生,工位上长期放着一袋开封的米饼,写代码时爱把脚搭在椅梁上。大家都不坏,也都很忙。多数时候,他们各自做各自的事,到组会前才会真正坐到一张桌子边来。

怀特摩的带人方式也很旧。

他没有给陆沉做什么正式介绍,更没有那种“欢迎加入我们大家庭”的话。第二天上午,他只是从办公室里探出半个身子,把三篇打印论文放到陆沉桌上。最上面那篇边角已经发黄,题目里有 无序 和 相变。怀特摩 用手指点了点那几页纸,说:“Read these. Then tell me which assumption you don’t believe.” 说完就回去了,连停都没停。

陆沉看着那三篇论文,有一瞬想笑。

不是因为轻松。是因为这种考法已经很久没人用了。别人要的多半是结果,是表格,是可以塞进申请材料里的那种明确进度。怀特摩 要的却是你先学会不信,对一篇已经发表、已经被很多人接受的东西,低头看久一点,看出哪一行偷偷替世界做了简化。

那三篇陆沉读了整整一周。

第一篇是 1971 年的,作者陆沉听过;第二篇是 1989 年的,作者他没听过,但摘要里有一段引用了第一篇;第三篇是 2003 年的,作者是一个还在世的德国教授,文章里直接挑战前两篇的核心假设。三篇放在一起,中间的连接没人替你串好,你得自己读出来。陆沉把三篇按时间顺序铺在桌上,第二篇和第三篇中间留了一指宽的空隙。他自己不知道这一段中间发生了什么,可他知道这段空隙正是 怀特摩 想让他看见的。

第三天傍晚,他在第二篇那一段关于尺度变换的论证下面画了一道铅笔线。这一段他读不通。他试着问 永,凯文 不在,永 看了一眼摇了摇头:“I don’t do this stuff.”陆沉自己又看了一晚上,到第二天早上,他在那条铅笔线旁边写了一行小字:“assumption: scale invariance survives discretization. Why?”

第七天,他敲了 怀特摩 办公室的门。

怀特摩 让他坐下。陆沉先没说自己读懂了什么。他先把那一行铅笔字念了出来。

怀特摩 听完,把眼镜推上去看他。

“问得好。” 他说,“你来找我之前,先去图书馆找一篇 1976 年的 威尔逊 综述。读到第三章。读完再回来。”

陆沉点头,没问 威尔逊 是谁。他已经知道。


那三篇之后,怀特摩 给他开了一个 reading list。

list 不是邮件发的,是 怀特摩 在一张废纸上手写的。十二条文献,每一条只有作者姓+年份,没有标题。陆沉拿到那张纸的时候,纸边已经被 怀特摩 用钢笔点了几个小黑点。他在自己脑子里数过这十二条,一条一条点过去。陆沉把这张纸折好,夹进笔记本第一页。后来这张纸他一直留着,不是因为它珍贵,是因为这是他来美国以后,第一次有人不在乎他的本科出身,只在乎他能不能读懂 威尔逊。

那一周陆沉早上六点起,晚上十一点回。第三天下午他在茶水间撞见 凯文。凯文 看见他眼下的青,笑了一下。

“What’s he giving you to read?”

陆沉报了一个名字。凯文 嗯了一声:“Yeah. He gave me that one too.”

“You finished it?”

凯文 把咖啡杯举起来碰了一下陆沉的杯子:“I tried. 跳了三章。”

陆沉没追问 凯文 跳了哪三章。他知道他自己不会跳。

凯文在这种时候通常会从另一条轨道上伸手过来。

陆沉第一次登录实验室集群的时候,账号权限一直报错。他对着终端看了十分钟,还没搞明白是学校VPN的问题,还是服务器目录没配对。凯文从旁边经过,扫了一眼屏幕,把自己的咖啡放下,弯腰在键盘上敲了几行命令。

“你少了个组权限。”他说,“怀特摩大概忘记点了。”

说完又直起身,像忽然想起这话会不会显得像在背后说导师坏话,于是补了一句:“He forgets practical things when he gets excited.”

终端界面一刷新,目录树就出来了。陆沉说谢谢。凯文摆了摆手,回自己桌前前又丢下一句:“Museum needs adapters. Otherwise nothing connects.”

那天中午,两个人在茶水间又碰见一次。微波炉里转着凯文前一天打包的墨西哥卷,塑料盖子被蒸汽顶得微微鼓起来。凯文盯着转盘看了几秒,忽然问陆沉:“你是真的不想做predictive models,还是你现在还不会?”

问题问得很直。

陆沉想了想,说:“都会一点。但我更想先知道自己在看什么。”

凯文听完,没反驳,只把微波炉门打开,热气一下冒出来。他端着盘子往外走时,像随口又像认真地说了一句:“Knowing what you’re looking at is expensive.”

怀特摩每周五下午开组会。

开会前一小时,实验室会出现一种很特别的安静。不是没人,而是每个人都在给自己的东西补最后那几笔。凯文会把屏幕上没跑完的训练日志先最小化,再打开一份排版干净的幻灯片;博士后会在白板边站一会儿,确认公式顺序;怀特摩则会拿着那本黑色硬壳笔记本,提前坐进会议室,翻上一周的记录。陆沉来的第三周,就轮到他做第一次正式汇报。

那几天他准备得很慢。

不是因为内容多,而是因为一开始他就不想按别人习惯的方式讲。他的初步想法很简单:不用端到端模型预测价格,而是用谱分解的方法提取市场中的集体行为模式,先搞清楚系统在发生什么,再谈它会不会往哪里去。这个想法写成句子不长,做成汇报却很难。因为一套方法没有数字、没有对照、没有标准排行榜上的位置,在现在这种会场里几乎说不出口,大家想看的就是那几行数字。

周五下午四点,会议室投影一亮,陆沉就知道自己躲不过这个问题。

会议室不大。百叶窗拉了一半,外面的天色发灰,落进来的光也带着一层旧。投影仪挂在头顶,风扇一直转,发出持续的低响。桌上放着一盒没人动过的甜甜圈,糖霜在纸盒边缘掉了一层。凯文 坐在靠后的位置,笔记本开着一半,手里转着一支黑色签字笔。怀特摩 坐在最前面,黑色硬壳本摊开,笔横在纸上,还没写字。

陆沉站到屏幕前,把第一张slide投出来。

标题很朴素,连个副标题都没有。第二张是数据和问题设置。讲到第三张时,他把自己的想法说了出来:“I want to use spectral decomposition to identify collective modes in the market, instead of treating the whole thing as an end-to-end prediction task.”

话音刚落,左边一位博士后就抬起头。

“What’s your baseline?”

问题来得非常快,像球还没落地就被人在半空里拦住。陆沉看过去。那博士后戴细框眼镜,手里还转着笔,语气不凶,甚至算得上公事公办。正因为公事公办,才更难躲。

“I don’t have one yet,”陆沉说。

会议室里静了一秒。

他知道这还不够,于是又补了一句:

“Because I’m not sure this is a prediction problem.”

全场安静下来。

投影仪风扇的声音一下子变得很大。凯文手里的笔停住了。有人把椅子往后挪了一点,椅脚在地上擦出一声轻响。怀特摩没有抬头,也没有替他说话。他只是在笔记本上写了一个什么词,然后把本子合上了。

陆沉站在屏幕前,能感觉到空气里那种很细的尴尬。

不是敌意。

是这间会议室一向沿着一种轨道往前讨论,他这一句话临时把别人脚下熟悉的那块板抽走了一秒。

那一刻他忽然想起多年前黎知秋在图书馆桌对面,把一道题写完抬头,问他:“你看的不是答案,对吧?”。那时她说他“不在同一个量子数上”。这间会议室里没有这样的人。

他后面还是把汇报讲完了。

讲得不算顺。有两页解释得过快,一页图太丑,另一页公式又写得太密。中途博士后追问过两次,凯文 也问了一句窗口怎么选。怀特摩 全程没怎么说话,只在最后收拾笔记本时留下一句:“Next week, show me what survives after you remove the obvious mode.”

这话不是肯定,也不是否定,是叫他下周再看一次同一块东西。

散会以后,人很快走了一半。

甜甜圈还是没怎么动。有人把投影关掉,房间一下暗下来一点。陆沉把电脑合上,正要收电源线,凯文从后排走过来,手里还拿着那支黑色签字笔。

“Shen,”他说。

陆沉抬头看他。凯文像是没意识到自己把“Chen”叫得有点偏,也可能早就习惯别人懒得纠正这种小偏差。他站在桌边,语气很平:“Can I give you a suggestion?”

“可以。”

“先跑一个baseline。”凯文 说,”哪怕是最简单的。ARIMA 也好,LSTM 也好,哪怕就一个 moving average。拿到一些数字,这样你至少有东西可以讲。不然教授们会觉得你在空谈。”

他说这句话的时候没有居高临下,也没有”我来教你做人”的味道。更像在这种会议室里待久了的人,顺手提醒一句不至于第一回合就被推出去。

陆沉把电源线绕在手上,停了一下。

“如果我先跑baseline,”他说,“我就已经接受了这是一个预测问题。”

凯文看着他,没马上接。

会议室门开着,外面有人经过,说笑声浮进来一点,很快又远了。桌上甜甜圈盒子边缘的糖霜被空调风吹得掉下来一粒,落在纸盒折缝里。凯文把笔在指间转了一圈,才问:

“Then what is it?”

陆沉说:“一个理解问题。”

凯文沉默了。

不是被说服的沉默,也不是不耐烦。他像被这句话扣了一下。他大约听懂这句话什么意思,只是已经很久不那样生活了。然后他抬手,在陆沉肩上拍了一下。

那个动作很真诚。

真诚得反而让人更难受。因为陆沉知道,凯文 的建议在今天这间会议室里是完全对的,在现在这个评价体系里,它就是最稳妥的那条路。

“I get it,”凯文说,“I just don’t think 屋子 will.”

说完这句,他像想起什么,转身去自己工位上翻抽屉。

抽屉拉开时碰到桌腿,发出一声轻响。最上面放着几个转接头、一叠会议名片和一块没拆封的能量棒。凯文在里面找U盘,翻到一半,一本旧笔记本露了出来。封面发黄,边角卷起,上面用黑色马克笔写着两个词:Phase Transitions。

陆沉的视线停了一下。

凯文顺着他的目光看见那本笔记,笑了笑。

“Undergrad stuff,”他说,“本科时候的东西。”

他把U盘找出来,又顺手把那本笔记往里面推了一点。

“后来发现这个方向太慢了。”

这句话说得很轻,没有自嘲,也没有遗憾。陆沉还是听出来里面那点几乎听不见的停顿,不是后悔,更接近一种”早已经收好”的克制。

凯文 把 U 盘插进电脑,屏幕亮了一下。

桌上的 Stanford 咖啡杯边缘还留着早上那圈浅褐色的印。白板上的 attention 推导最后那个对号黑得发亮。LinkedIn 页面已经关掉了,换成训练日志和会议日程。凯文 在键盘上敲了几下,屏幕跳到一份 NeurIPS 的 rebuttal 模板。他抬手把袖口推上去一点,开始往里面填字。

陆沉站在一旁,看着那本只露出一截边角的 Phase Transitions 笔记,没有再说话。

窗外天快黑了。实验楼走廊的灯一盏一盏亮起来,白得很均匀。会议室那边有人关门,传来一声不轻不重的闷响。凯文 低头继续敲键盘,动作很快,刚才那一段对话,他已经接着往下走了。

陆沉把电脑抱起来,转身往自己那张空桌走。

桌面上还摊着他刚才汇报时用过的笔记。最上面一页只写了一个词:基线。旁边什么都没有。


那天晚上他回到公寓,没有立刻打开电脑。

他站在厨房水槽前洗了一只用了三天没洗的杯子。杯壁上的咖啡渍泡了一会儿,用海绵擦才慢慢淡下去。洗完以后他把杯子搁到沥水架上。屋里只有冰箱压缩机一下一下的低响。

他打开冰箱,里头还剩半盒鸡蛋和一袋打折番茄。

那一瞬他想起 凯文 拍他肩膀时那种诚恳,不是装的诚恳,是真的诚恳。这种诚恳让他更难。如果 凯文 是恶意的,他可以站住自己的位置;可 凯文 是对的,在现在这个体系里,他的建议就是最稳的那条路。

陆沉站在冰箱前没动。冷气从下面慢慢漫到他脚踝。过了一会儿他把冰箱关了。他没有煮饭,也没有找其他事做,就这么坐到桌前,把那本笔记翻开,在 基线 那个词下面慢慢写下三个字:

“还没。”

他把笔放下。窗外街灯一盏一盏亮着,落在公寓地板上是均匀的橘色。陆沉靠到椅背上,看着天花板看了一会儿。第二天早上他要回到那张空桌前,重新开始。可这一晚先这样过。

那个秋天他没改变方向。冬天来了又走。再过半年,怀特摩 在感恩节前的某个周二下午把他叫进办公室,问他愿不愿意以博士生的身份留下来,从下学期开始正式做这个方向。陆沉答应了。

← 上一章:旷野中的灯 ← 返回目录 下一章:暗物质 →

 

Yuda Bi  |  Built with Quarto