路漫漫,且行且问
1
虽然之前每次写学期小结和自己的年度小结的时候,经常会写着写着就发现写了大几千字了。但是这一次写毕业小结还真不知道如何下笔。可能是四年的跨度已经足够大,而那些早期的记忆已经有些模糊。但到了这个时刻,也确实值得花一个下午,坐下来好好回顾一下自己的大学生涯,给自己做一个总结了。
刚接触到ACM班是在高考出分后不久。那时候分数还算高,但也没有到稳上清北的地步,但也还是怀抱着一些志向,想在大学继续冲刺。而在高中培养的对于知识本身感兴趣的理念,也让我自己在接触ACM班之前,本来就希望走上科研的道路。此时和俞老师的面试的机会则是更进一步地推动了这样的想法,也让我获得了进入ACM班,享受这样的资源的机会。
而在进入大学之后,首先接触的还是上课学知识,但我对于知识和研究的态度却发生过很多波折。从学习上来讲,我感受到明显的问题就是节奏变快了很多。前面高中的很多时间都会一遍遍地反复去练许多题,给足了训练的轮次和数据量,但是大学之后,首先是节奏变快了,其次还需要自己安排时间。不行高中那样强制排好的时间确实是带来了不小的挑战。刚开学时的疫情更是雪上加霜,网课让课程的参与感更是下降了一大截。而这一切叠加起来之后,我也确实没能很好的应对过去。大一上的成绩还算勉强,大一下就惨遭 qualify 了。在这个过程中,我的意志也在一点点的钝化。具体来说,知识的难度和学习的节奏都变大以后,我在逐渐失去对知识本身的兴趣,变得只是为了完成任务。而后面面对一些观念的冲击则让我开始有了一点开摆的想法,仿佛不做的那么好,也是可以接受的。再更进一步地,我的观念有点异化成了,不那么感兴趣的事,就当完成任务就行了。所以对学的知识没那么感兴趣了,加上这样的观念,就让我的学习变得没那么主动。最后也是导致了在 qualify 的时候和俞老师争了一下。但也多亏有这样的流程,给了我再次反思的机会。在 qualify 之后,我回去也反思了很久。我意识到之前我是认为不感兴趣的就直接放弃了,但是其实应该还是要考虑如何让自己去变得感兴趣起来,去培养这方面的意识。所以后面的学习我还是在往这方面的意识去靠。但可惜的是,我似乎一直都只有一点淡淡的情感,却一直难以把握那种强烈的追求的感觉,也正因这样,导致后续的我成绩虽然有所进步,但学习的状态还是没有达到最理想的样子。对此还是感觉比较遗憾。
另外从另一方面来讲,我一直有一个心态,就是比我厉害的人太多了。但我这是一种比俞老师说的“归零”的心态程度更极端的想法。我感觉比较健康的理解应该是不要因为一开始做不好而过于沮丧,而是接受自己一开始的不完美,但还是坚持努力成长。但在我的潜意识里,这变成了我一直就是比他们差,这是“正常”的。但这就导致我会丧失很多追求的动力。我应该也经常看到所谓的“成长型思维与固定型思维”的说法,大概也是前面的说的那两种感觉。在以前,我确实觉得成长型思维很好,非常合理,理所应当的就应该是这样。但在很后来,某个时刻我才猛然发现,其实我自己一直都是固定性思维。我内心深处依旧害怕着自己会表现得“不够好”。但我却只是表面上表现的像“能接受自己的失败”,以为这样就够了,来否定后者所描述的“害怕犯错”的特征,但我的内心依旧是消极的。我可能会承认努力是可以提升能力的,但我没有努力的意愿。我不是不相信努力能改变结果,但我却没有这样的追求。总的来说,我只是做到了“接受自己的失败”的层次,却没有做到“再努力做到自己的最好”的地步。
当然,还有一个很直接的想法就是,如果我能有一个愿景,有一个未来的理想,那我可以朝着这个理想去努力。但我实践起来却发现还是难以做到。我一直觉得这个理想离我来说非常的遥远,以至于遥远到难以为我提供直接的动力。当然,我理应讲其拆解成更容易实现的目标。但这样却又出现了一个矛盾:这个拆出来的目标,要么依旧遥远,要么离我很近时,目标本身离原来的理想又过于遥远了,以至于又难以和理想建立联系。所以到最后,我在通过愿景和理想提供动力的尝试的结果还是不太理想。
在学习这方面还有一个遗憾,就是有一些看上去的水课和通识课,就没有太认真听,比如学术写作,近现代史纲要什么的。但其实包括后来与同学们聊天,都还是觉得老师们挺有特色,也比较有水平。可惜当时只想着在课上多做一点作业。但其实是很亏的,做作业也不差上课那点时间,而且课上做了之后,不上课的时候我也不够自律。加上前面所说的完成任务的态度,就会导致在没课的时候,如果又没有任务,反而无所事事消磨时间去了。而那些课的内容,虽然看上去相对没那么“重要”,但应该还是挺有意思的,而且可能还能塑造我对事物的一些看法。其实相当于调节我大脑的参数了。可惜我当初刻板印象还是太重了,不愿意放下心来老实坐那好好听讲。
这样看下来的话,我这学习的态度和状态还是非常糟糕,而且各个层面相互叠加,像前面提到的兴趣的问题,追求的心态的问题,以及课上课后的行动,导致回过头看就感觉很遗憾,什么都没有做好。而且讲实话,其实我算是一直在这个问题上翻车,就是努力不起来,或者说就是太懒了。比如说这个兴趣的问题,我可能也尝试了许多方法,比如说先让自己投入起来,写一些笔记,保持在课上的专注等等。但是稍微假设哪次没这么做,然后就开摆了。包括读论文,一开始也在尝试做点笔记,深入理解一下,结果做了一篇之后就没下文了。总结一下就是太容易滑坡了,建立一个好的习惯还是太难了,稍微没有维护就直接翻车。而再结合我那“没有想做到很好的目标”的心态,导致我确实还是一直是得过且过的心态。我也看到身边有的同学真的非常拼命的想把事情做好,其实我也挺羡慕他们这样的心态,虽然他们自己也说这样非常痛苦,但终究是我没有体会过的,而且确实对自己的能力和结果能有很大的帮助。
但话是这么说,这学习的过程里面让我觉得最有意思的还是写一些编程大作业的感觉,确实是给我一种在用代码搭建自己的作品的感觉。这种一点点去设计,实现和调试的过程确实令我沉浸其中。也因此,我暑假 PPCA 和编译器的出勤时间应该是很高的,应该几乎是最早到的之一。另外就是有一些大作业也是班上最早通过的,还是能带来一些成就感。可惜到了后面 LLM 发展起来之后,就很少再自己一点点手写代码了,它的能力和效率确实是越来越高,但也由此带来了一些弊端。比如说到了大二后期和大三那会,相关课程的代码就基本上是用 LLM 写的。虽然说是也会去了解一下大概是怎样的逻辑,怎样的结构,但还是没能做到像自己一行行敲出来这样吃透。比如说像正向传播反向传播这种函数,我就从来没有自己写过。导致的结果可能就是我对于,比如说 AI 的一些知识只停留在了概念上,但印象就又更浅一些了。当然,根据我的印象,哪怕是实践了课堂上的作业之类的代码,其与前沿的研究实践也还是有较大的差距。我觉得这样还是有些可惜的,毕竟我们前两年确实通过各种大作业,编译器等练习了不少编程能力,但我并没有在自己的研究中很好的结合起来。而且现在 agent 出来,这样的问题应该会更加加重。agent 现在确实非常方便,叫他干什么事基本上都能很好的做好。但对人来说,“为什么”做就更加重要了。现在属于是必须要知道为什么做。才能更好地指导 agent 来做,那未来对科学家的能力的需求可能就会更加不一样。但在培养相关能力的过程中,agent 却又可能
而到了大二下,开始实验室轮转以后,我们的重心从上课开始往科研方向转变。我也才开始懵懂地了解这个领域。在最后选择导师,以及研究方向时,也曾非常犹豫。但可能和大部分犹豫的前途之类的不一样,我只是在考虑自己现在,和未来,到底想要做什么。可惜我的成绩没能让我去成当时最想去的导师那里,于是也走上了现在搞 NLP 的道路。具体的经历其实也在前面实验室实践的小结,和学期小结等各个地方都写了。总的来讲,我觉得其实延续了前面的习惯,就也还是在做,但是比起那些很拼的同学来说还是少了很多。虽然我的成果看起来也不少了,但确实没有中的,每篇的质量也还是没有达到我理想的水平。
说到这里,也可以总结一下我做的工作。我觉得 LLM 时代入科研,特别是 LLM 本身这行还是不太容易的。要深刻的了解最底层的东西也没那么容易,加上我之前学习的基础也不是特别好,所以刚开始的时候只是在做一些比较外围的事情,比如建立 benchmark,简单训练模型等等。后面了解的一些相关工作,其实也是围绕比较外围的东西来设计,比如说人为设计一些 agent 的工作流,设计一些基于 LLM 的模块这些。而我最开始做 benchmark 是觉得做这个上手比较容易,但后面发现其实很难讲好故事,讲清楚做这个的动机。但我最近的工作的出发点就确实还是有所不同,是我想做某个问题,发现确实没有相关的评测基准,因此才想先自己做一个。但难度也还是在于,我自己确实想做这个问题,但也要说明白这个问题是真的值得做。
但我觉得比较遗憾的还是,我没有去做到很底层的,比如说去深刻的了解一个网络结构,或者训练的方法,具体是如何设计的,为什么要这样设计。以及能不能自己提出一些新的方法,去实践一下。这里就又回应到之前的学习习惯和写代码的问题了。由于我研究的问题又确实不涉及那些,我平时可能主要就想着去推研究进度了,也没有去了解那些方面的欲望和习惯,现在想来也还是很遗憾。以至于我和别人聊天的时候,对方对这方面侃侃而谈,从这里我也能感受到对方确实是有很浓厚的兴趣,可我只能比较被动性的回应。
最后说的申请这方面,我只能说,外界的原因和我自己的原因肯定是都有的。一方面我确实在暑研在一路过来非常倒霉,另一方面我也觉得自己一直以来做的不是很好。这二者结合起来,造就了我现在这样悲惨的情况,只有一个勉强还行的保底。如果说我没那么倒霉,没有被中途“背刺”,那可能和其他同学走一样的流程,最后也可以拿一个 return offer。但可惜没如果。而且在那之后我的处理也不是很好。导师的选择上,选了一个方向不那么一致的,像尝试一下改变,但后续工作的时候又遭遇进度问题,只能做回原来的方向,导致也不太匹配。确实就只是能勉强做一些成果出来了,也难以令我自己满意。
但其实,即使在写这些的时候,我也还有一个问题:我到底是按照什么标准在评价自己?比如说我前面说这么大一堆,我觉得我自己做的很不好,但这好与不好到底该如何评定?我成绩很不理想所以就很不好吗?我最后申请的结果不好所以就很不好吗?我自己想要的到底是什么,这个评价到底由谁来给。即使我说让我自己来评价自己,但我又要如何评价自己,我参考的依然是他人给我的标准,是那些被默认、公认的维度。但果真需要这样吗?一定是要申请到好学校,或者弄很有影响力的研究,做出一番大事,赚很多钱吗?只能说我们班的理念是这样的,而且我们占了这么多资源,理应是该这样的。但对于我自己来说,总感觉在这一整套标准之外,还缺了一点说不清的东西。我觉得拿这些来评价也没有什么问题,我也确实可以参考这些来评价自己。但我希望我不只是直接拿这些标准来作为我的目标和规范。我更在意的,可能是这些标准背后真正重要的东西,比如它们为什么会被认为是“好”,它们对应的能力、状态或者意义究竟是什么。也许这些不是一时就能想清楚的,而是需要在过程中慢慢体会,而这一点本身,也需要我去认真对待、用心去做。
那么,如果能重新来一次的话,我可能需要先接受一件事:动力的问题未必能被真正解决,它很可能一直都是不稳定的。与其期待自己始终有足够的热情,不如换一个更实际的做事方式——只要开始做一件事情,就尽量把其中至少一部分真正做透,而不是停留在完成任务的程度。之前在一些编程大作业中,我其实体验过这种从设计到实现的过程,也更容易进入状态。如果能重来,我应该会更主动地去保留这种过程,而不是在后面逐渐转向以完成任务为主。像 LLM 这样的工具,确实可以帮我完成很多事情,但如果关键的部分没有自己走一遍,就很容易停留在“知道大概在做什么”,却没有真正掌握。因此如果重来,我可能会给自己加一些约束,比如对一些基础或核心模块,至少手动实现一次,哪怕是简化版本,也比完全依赖生成要更有意义。再就是比较重要的暑研,之前确实没有意识到暑研的影响会如此大。而且当时也不是一些具体的失误,而是确实是通过一次变化就完全陷入了被动。如果能重来一次的话,我肯定需要留好足够的后路和应对方案,而不是在一个老师中途出问题后就有点慌乱,导致后面一连串失利。总之,对我来说,可能更重要的是在过程中不再轻易退回到“做到差不多就可以”的状态,而是至少在一部分事情上,尝试把它真正做完、做好。
给 5 年后的自己:希望你这些年没有被工具所代替,而是至少成为一个能把这些不断变化的工具用起来、并真正做出点东西的人。
给 10 年后的自己:三十而立,这个时候的你,应该已经过了最不确定的阶段了吧。也许很多事情都已经慢慢定下来了,只是希望你没有在一路往前走的过程中,把自己弄得太累,也没有把原本在意的一些东西一点点丢掉。
给 20 年后的自己:四十而不惑,那时候的你,大概已经过着一种比较稳定的生活了吧。也不去想你是不是有多成功,只希望你回头看现在的时候,不会觉得这段时间是可以随便带过的,也还能坦然地面对自己当时的选择。
2
在写完上面的内容之后,我突然意识到,我也可以把这些给LLM,看看它们的评价。这样我可以得到一些新的反馈,还能直接进行一些迭代,也可以写一点小结的小结。
LLM 提了一个很有意思的说法,它提出了一个主线:“在高水平环境中,没有真正进入主动成长状态,并逐渐失去驱动力。“相当于把我的问题的几层串了起来。另外由于整体是回忆着心路历程写的,所以它们会觉得结构上可以再优化一下,一些深层心理的篇幅可以更多一些。但我可能也还是需要进一步的沉淀和消化,所以有一种点到为止的感觉。
总的来看,感觉我这小结写的还是非常惆怅的,这毕竟也与我现在的心态有关。由于申请结果不理想,确实一直处在一个比较忧郁的状态。但更深的惆怅可能来自另一件事:我写了这么多,却发现自己对很多问题还是没有答案。不知道动力该从哪里来,不知道评价标准该是什么,不知道那些"原本在意的东西"到底是什么。这些问题在写的过程中一个个浮出来,但没有一个真正被解开。而我的小结也没有写成"虽然走了弯路,但我成长了很多"的励志故事。可能在我不知不觉的地方其实也还是有一些成长的吧。只能说,现在还算是尽力在剖析自己了,但是一些悬而未决的问题也确实还只是留在那里。但至少也算是在诚实的面对了吧,也不算是简单的就喊一下口号。至少说明这些问题我还在认真对待,没有随便给自己一个答案敷衍过去。可能确实是需要接受这样的一个现实,有些问题确实是很难直接有一个解决方案的,但也不是说就摆了,而是要接受它一直伴随着自己,但同时也是不断尝试着与其抗争。就像我提到的成长型人格那样,既然我现在意识到了,那在自己想退缩的时候,也还是可以多推一推自己了。
3
写了这么多下来才发现完全沉浸在自己的心路历程里了,都没怎么提“携手”,那刚好单独开一章来写写。我觉得还是很有必要回顾一下的。ACM 班确实是具有很强,很独特的凝聚力。我在上大学之前听到的说法就是高中交的就是最后的朋友了,上了大学就没有这么多交集了。而我和其他地方的同学朋友聊天,他们告诉我的行政班的感觉也都是基本相互不认识的感觉。相对之下,我们班一路下来确实是给人很不一样的感觉,也带来了很多优势。一方面,学长带来的传承,这种助教的形式,一级级下来对于课程内容的迭代,都不断在优化我们的体验。另一方面,同学之间的相互帮助也建立起了深厚的友谊,也让我交到了很多很好的朋友。那些奋力冲刺大作业的时刻,校园漫步时的讨论,都令我难忘。他们的真诚帮助也常常令我非常感动,在我生病时陪我去医院,在我申请和面试需要帮助时给我细心的指导。前两章写了很多遗憾、困惑、那些没能做好的事。但回头看,这四年里有些东西是确实留下来了的,这些人就是其中最重要的一部分。在最难的时候有人在旁边,这件事本身,可能比很多事情都更难得。