我的 22 岁|生命的意义就是看一棵树的春夏秋冬
在这一年里,AI 做事情的能力突飞猛进,渗透进了我工作生活的方方面面。这导致我的注意力,我的思考方式,甚至于我对这个世界的感受都发生了潜移默化的变化。我跟 AI 说,我需要一些改变,他建议我更多地把被动输入变为主动创造,于是便有了这篇文章。
Close the loop
每年我都会在自己的生日前后写这样一篇文章,总结回顾我这一岁的思考和成长。我会把微信读书的划线、笔记中的摘抄,还有各大平台收藏的内容,全部翻出来审视一遍,然后把这些零碎的思想梳理成一篇相对有逻辑的文章。
今年我本想让我 AI 来帮我做这件事。通过接入微信读书的skills,我的 Agent 给我制作了一份详细的读书报告;通过飞书 CLI,我的 Agent 得以访问我所有的笔记内容,分析我这一年的心路历程;通过 agent-reach 和 agent-browser 等浏览器工具,我的 Agent 得以访问我所有内容平台的收藏夹和点赞记录,画出我关心内容的词云图并给出相关推荐。
这些操作很 fancy,但产出的这些内容没有一个能够打动我,没有一个能给我带来真实的情绪和感受。
这是我今年与 AI 相处的常态,由于拥有对最先进模型几乎无限量的访问权限,我患上了严重的 「Token 焦虑症」。我给我的龙虾接了很多的定时任务,让它定期巡检网络上的信息源、检查我的资产配置,甚至自动帮我完成待办清单里的任务等。我在睡前总是会想办法在 Claude Code 里挂上那么几个长任务,然后等早上起来验收它的工作成果。
刚开始我很享受这种自己搭建自己的工作流的感觉,因为我似乎对自己的工作环境拥有了完全的掌控感。我想要什么样的工具、做什么样的分析只要动动嘴就都可以搞定。我每天打开 3、4 个命令行窗口,让 AI 并行地给我做好几件事情,贪婪地享受着生产力提升的快感。
但很快我发现这样行不通。我听的播客《三五环:No.214 低能量人的电池使用指南》,提到了一个切换成本的问题,说是我们的精力很大一部分其实不是在做事情的时候被消耗的,是在不同的事情之间来回切换被消耗的。就像电脑不断地把硬盘中的内容载入到内存里,这个读写的过程会消耗很多的算力,最终导致精力耗尽。
AI 可以通过「思考-执行-反馈」的循环来不断地推进任务,比如 Claude Opus 4.8 已经可以不间断运行六个小时来完成一个代码库重构的任务。面对如此强大的 AI模型,我的注意力和上下文窗口都不占优,这时人类的监督和反馈就成了最大的瓶颈,因此我想我需要把人类从这个循环当中拿出去。
我学习 Andrej Karpathy 开发 auto research 的理念开始搭建自己的全自动科研工作流,让我的 Agent 可以 24 小时不间断工作。Anthropic 的 Boris 最近也提出了 loop engineering 的概念,指的是构建一个闭环让 AI 可以自动化的工作。比如让一个 AI 定时地去审查一个代码库,发现问题就直接提交一个 issues 到 GitHub 上,然后另外有一个 AI 会检查 issues,一旦发现有新的问题被提出,它就会自己工作来修复这个问题,然后提交一个 PR,最后由人类来审查这些 PR,如果没问题就把修复合并到代码库当中。这个想法也是想把人类从繁杂的测试和debug工作中解放出来,让更擅长这些工作的 AI 去完成这些,人类只负责最终的质量把关。并且我相信,随着 AI 在软件工程上能力的不断进行,最终这整个流程都不再需要人类参与。
我还去研读了 Google DeepMind、Sakana AI 等知名机构发布的 AI Scientist 相关的论文。他们设计了一系列闭环的系统,让 AI 可以自主地完成「提出想法-文献调研-实验验证-数据分析-论文写作」的全流程,系统产出的论文有些已经能够被 ICLR 2025 workshop 接受。
但是,做科研和写代码毕竟还是不同,AI 产出的内容,不管是生成的图片还是写出的论文,乍看已很接近成熟作品,但是但凡认真看进去就会发现,漏洞还是非常明显的。AI 非常擅长写那种看起来正确的废话,文本流畅,引用考究,样式精美,但在提供的洞见和证据脉络上与人类专家还是相差甚远。
这其中的原因也很好解释,目前最强AI的编程和数学推理等能力基本都是通过强化学习(或者是类似的 on-policy distillation 方法)训练出来的,强化学习的特点是需要一个明确的奖励函数,设定一些 rubrics 来判断模型在这一轮的推理中做的好不好,如果做的好我们就奖励这个模型,让他以后可以继续这么做,做的不好就施加相应的惩罚。这样的训练方法在编程和数学推理这种有明确答案的「可验证」任务上可以很好的提升模型的能力,但我们真实世界中的大部分任务都是没有明确答案的,在这些任务上,我们人类的判断力、强大的跨领域少样本学习能力和从繁杂思绪中组织出逻辑与故事的能力依然宝贵。
王骁说,AI 相比过往所有技术革命的一个区别是,过往的技术革命可以替代人类劳动,而 AI 不仅可以替代劳动,还可以代替人的思考。今天如果一个人不主动进行思考,而是一味相信 AI 给出的答案,他将直接失去思考的能力,不但不用思考,别人帮他思考之后,他还以为自己思考了。
我的 mentor 很看重 critical thinking 的能力,他给我们分享了他用 Claude Code 的方法,我跟他学到了很多。于是现在我用 Claude Code 的方式是,我会花大部分的时间去批判模型的判断和方案,给模型分享自己的 domain expertise,分享自己从过去实验和论文当中学到的 insights,甚至包含一些哲学思考。等到我和模型终于讨论一个满意的方案后,我会让 Claude Code 花一整晚的时间去跑实验(使用 goal 模式,或者使用 ultracode 的workflow),等第二天早上我们根据最新的实验结果讨论下一步的做法,如此循环。
回到本章的标题「Close the loop」,我认为一个好的 loop engineering 一定不是把人类从循环中剔除出去的 loop,人类永远应当担任这个 loop 的主导者,担任问题的提出者去 challenge 所有 AI 交付的结果,担任一个有耐心的评估者去看每一个异常并让 AI 做 error analysis,担任一个最终质量的把关者并自信地交付结果。对我个人来说,我并不对一个完全自主的 AI 系统感到兴奋,不管这个系统能如何地加速科学发现,如何地解放人类生产,我始终相信思考和劳动才是人类的普世价值,AI 可以帮我完成其中90%繁文缛节的部分,而我们要牢牢把握剩下那10%闪耀着人类思想光辉的那部分。
有些失去不会变成哭声,只会变成语言深处的阴影
今年 1 月去看了浦东美术馆的年度大展。
浦东美术馆的策展水平真是国内一流的,再加上这次的展品质量足够高,体验还是非常好的。浦美不是简单的把展品放在那里,然后边上贴个标签印上名字,而是给大部分展品都写了很详细的文字介绍。比如说毕加索的特展就被分成了好几个章节,表现毕加索人生各个阶段不同的创作风格,整个展区都按照章节的风格做了对应的装潢,时而是鲜亮的红色,时而是压抑的深蓝色,时而挂满了毕加索穿的海魂衫,时而贴满了毕加索世界各地展览的宣传海报。
毕加索一生中最优秀的作品我应当是都看过的,我记得在中学的美术课第一课讲的就是他的《格尔尼卡》,给我幼小的心灵带来了一些震撼。后来在纽约现代艺术博物馆,在北京的中华世纪坛有陆陆续续看到了一些真迹,但我好像从来没有深入了解过毕加索这个人,和他作品背后的丰富内涵。
但这次跟随策展人娓娓道来的文字讲述中,我真切感受到了他在人生不同时期心境的变化,开始看见他用抽象作品表达出的复杂心境。艺术家同我们一样也是普通人,只不过他们更会表达。他会在情绪低落的时候用阴沉的色调画裸体女人,也会在幸福的日子里使用明快鲜艳的色调画自己的恋人。他说:「我花了四年学会像拉斐尔一样画画,却用一生学会像孩子一样画画」,他用自己抽象的笔触和创新的技法来表达自己强烈的个人情感,同时带给读者一些强烈的视觉震撼。
即使后来居住在法国,他的作品还是包含了浓厚的西班牙色彩,和反映了自己的童年经历,比如他非常热衷于西班牙的斗牛文化,画了很多斗牛相关的作品。米诺陶和斗牛是他最著名的神话母题。
战争,暴力与受难是另一条贯穿线,从私人层面的撕扯到公共层面的灾难。他不只是画战争场面,更常画受难的身体:扭曲的肢体、尖叫的嘴、碎裂的空间。
策展人把毕加索一生的线索概括成了几大母题,具体的内容不太记得了,大概是有早年间对女人与欲望的探究,后来对战争与暴力的控诉等,包括他对自己西班牙文化和成长经历的解构。少楠说,人生最重要的目标之一就是「找到自己的母题」。从毕加索身上,我学到了一些找母题的方法,首先是个人的,然后是民族的、国家的,最后是世界的。不止做艺术家如此,做任何行业都需要这样,先做广泛的研究(比如他年轻时大量研究的伊比利亚原始主义、非洲艺术、塞尚的形式观念等),然后发掘自己的母题,做一些 interdisciplinary 的大胆创新,活出精彩的一生。
这用乔布斯的话来说就是「connecting the dots」。乔布斯在斯坦福大学的毕业典礼演讲上分享过,正因为他当年旁听了书法相关的课程,才让苹果后来优雅的系统字体成为可能。
艺术是有一定门槛的,就像小说家会挑选自己的读者一样,有一些人翻开畅销小说,读不完第一页就会弃书,画家也在筛选自己作品的观众。有的艺术是人人皆可欣赏的——比如拉斐尔,文艺复兴写实派的代表,栩栩如生,光影变换,笔下的圣母圣洁而宁静,哪怕是没有接受过宗教熏陶的人,也会看得入迷吧。而现代艺术的门槛则更高。毕加索的画,需要了解西班牙斗牛文化、非洲艺术、他的生平经历才能看懂,这无疑是对观看者提出了更高的要求,只有把所有碎片拼凑到一起,了解一幅画背后的深刻内涵,才会让人收获巨大的精神满足。但在此之前,他开创性的解构主义、立体主义手法,无疑为他的作品设定了极高的门槛,如果没有策展人的精心设计,恐怕他同时代的许多人,乃至今天的许多人,看毕加索时,仍然只能看到一地碎片。
我经常有这样的一种感觉,国内其实现在根本不缺好的展品,而是缺乏用心讲故事的策展人,或者说缺乏认真讲故事的能力。策展人的价值就是替观众把碎片拼起来,降低门槛。毕加索需要策展人,我们灿烂的历史文化也同样需要。
就拿南京周边来说,就遍布着大大小小三十多处六朝时期的陵寝石刻,有王侯墓前矗立的吐舌石首辟邪,也有帝陵前配备的天禄和麒麟。其中的辟邪正是南京市徽与南京大学校徽上图案的由来,是南京的精神象征。5 月,我偶然看到南大地理协会发的名为「工业烟云 六朝遗梦」的漫步路线,从南京炼油厂,到尧栖线甘家巷铁路道口,到南炼集贸市场,再到萧融墓神道石刻,串联起了宏大的工业年代、寻常百姓的市井生活,和遥远的南朝旧梦。
我们抽时间去走了这条路线。刚开始的一段很有「工业朋克」的风格,错落交叠的铁路道口,高大的烟囱和炼油设施都深深吸引着我。我从小就很喜欢这种风格,一座巨型的钢铁厂、炼油厂,一条条铁轨和列车,亦或是腾空而起的大飞机,都代表着那个年代人类文明的最高水平,是几万甚至几十万人类同心协力建设出来的产物。
在中国,这样的城市还会蒙上一层独特的计划经济时代的滤镜,在原本空无一物的长江滩涂和六朝石刻之间,由无数劳动人民勤劳的双手从零建起一座城市,这座城市全然为一座工厂服务,随着工厂的发展,大家用工厂的冷却水建起了澡堂,为了安置工人的家属建起了一个个南炼小区,后来为了满足工人们的精神需要又有了电影院,歌舞厅……
现代生活在城市中的人们,已经很少意识到,我们日常使用的物品,背后经过了多少道精密复杂的处理工序才来到我们面前。但在金陵石化的家属院里,依然住着大量老一辈石化人,在过着日复一日平淡的生活。这里的时间仿佛停止了一般,一切都还是上世纪九十年代的样子:一栋栋整齐排列的赫鲁晓夫楼,老派的菜场、小卖部和澡堂。小卖部里依然在卖 5 毛钱的南京板鸭和辣条。
萧融墓神道石刻就藏在这样老式小区里,一块并不起眼的草地上,如果不是特意导航前往,我想很少会有人注意到。两只辟邪相对而立,均做昂首跨步状,神情很是威武。辟邪旁的石刻已经斑驳褪色,只能艰难辨认出这是桂阳王萧融墓的神道石刻,大墓在此处往西北一公里处。我们看了地图,一公里处已经到了长江边,约莫是在如今的南京新生圩长江大桥的位置。
沉舟侧畔千帆过,病树前头万木春。
宋齐梁陈曾经花费大量人力物力建设的神道石刻,现在已经被掩埋在工厂的烟云中无人问津;而建国后无数人用血与汗建设起的金陵石化厂,现在也成为了复古和落后的模样,被滚滚向前的科技洪流甩在了身后。
我很难用文字精准地描写出这种忧郁的感觉,有点像奥尔罕·帕慕克在《伊斯坦布尔:一座城市的记忆》中反复写到的一个词,呼愁(hüzün)。
这个词很难直译成悲伤。它有旧帝国远去后的余温,也有现代生活到来后的不安。一个城市经历过辉煌,又在退场之后学会沉默。一个民族进入新的秩序,却仍然听见旧世界在身后回响。它像旧城里的光,灰而不暗,落在墙面窗台,家族相册和黄昏的街道上。人们走过那里很少开口,却像一直带着某种旧日的回声。
——一叶和春浅《土耳其文学,如何读懂一座城的百年忧郁》
文中还写道:「现代生活要求人向前,历史记忆却不断把人带回身后,所以土耳其文学常常有一种特殊的迟疑。他写现代化之后,人如何重新辨认自己,有些失去不会变成哭声,只会变成语言深处的阴影。」帕慕克的词帮助我辨认了当时站在厂区和石刻之间的情绪。我们作为勤劳和智慧的民族,都拥有灿烂的历史和文化,但现代化的浪潮滚滚向前,这些厚重的历史或者被挤压到博物馆里,或者随风飘散被逐渐遗忘。
我们想做点什么,让更多的人能感受到历史背后的文化和故事。借着学校本学期的 AI 产品课程,我们做了一个 app,让 AI 充当讲解员,为用户推荐历史文化路线,并把其中的故事娓娓道来。人来整理值得讲的故事,Agent 针对不同人生成讲述。我自我感觉这个产品是站在科技和人文的十字路口,我提供的是一套让大模型在人划定的边界内工作的脚手架,由人文社科的同学来贡献真实的高质量的内容。
我相信随着我们人文社科领域的发展,会有越来越多的历史故事被发掘出来,有人会花数月的时间在浦东美术馆策划一场毕加索的大展,那么也将会有人来为南京炼油厂,为饱经风霜的南朝石刻策展,为南京这座伟大的城市策展。现代化的去处,也要立足于我们自己的母题,首先是个人的,然后是民族的、国家的、世界的,并终将回到我们的来处,我们的先辈,和我们脚下的土地。
让我把脚丫搁在黄昏中一位木匠的工具箱上
《让我把脚丫搁在黄昏中一位木匠的工具箱上》是现代诗人海子的一首诗。
我坐在中午,苍白如同水中的鸟
苍白如同一位户内的木匠
在我钉成一支十字木头的时刻
在我自己故乡和门前
对面屋顶的鸟
有一只苍老而死
……
我记得我自己来自一个更美好的地方
让我把脚丫搁在黄昏中一位木匠的工具箱上
或者让我的脚丫在木匠家中长成一段白木
……
刚看到这首诗的标题时,「脚丫」、「黄昏」、「木匠」等关键词,让人自然而然地联想到慵懒的、亲近自然的松弛场景。但细读内容发现并不是这样,诗人借用《圣经》中的种种意象来表达自己圣灵信仰的困境。之前我很不能理解海子的诗,觉得晦涩难懂,不知所云,觉得那是知识分子的无病呻吟。直到最近,我在一个咖啡店里再度翻开一本海子的诗集,随意读了几首,我发现很多内容我都能读懂了。他所描写的苦难似乎就是在我身边真实发生的,而他所刻画的那种细腻情感,用任何普通的文字概括出来通通都虚弱极了,我想这就是为何我们仍然需要诗歌。
这一年,我的生活方式发生了很大的变化,这种变化主要是读研的节奏带来的。过去的生活更像迁移和漂泊,没有特别固定的轨道;现在每天的工作对象、评价方式和下一步都更清楚;过去会因为一个无用的念头读很久、想很久,现在更习惯问它能不能变成论文、实验或项目;现在把更多的时间花在做具体的事情上,但常常感觉自己处于一种「自动驾驶」的麻木状态,长篇记录自己的想法反而少了,也很少再突然被一个东西击中。
我理智上知道,现在的状态更适合做出色的工作。只是说实话,我还没有完全适应自己正在成为的这个人。
我有一些办法来对抗这种钝化的感受,比如迷你冒险。迷你冒险指的是定期找一块时间,去寻找一些让人能感到兴奋的事情,跳出循规蹈矩的生活。这段时间可长可短,短的话可以去探索学校里一个未知的角落,长的话可以周末去徒步,或者去参加一场黑客松。
如果迷你冒险是通过「动」的方式来丰富人的情绪感受的话,那么诉诸电影、音乐和书籍就是通过「静」的方式。我今年尝试了去书店快速读完一本书、去图书馆借书和微信读书等多种方式来拓展阅读体验。除此之外,我觉得冥想和走进教堂也是一种很好的让自己静下来的方式。
不管用什么方法,收获到的情绪感受都远超互联网上贫瘠的词汇和短视频所能表达的。守护好自己宝贵的注意力和感受力,便是我今年自我博弈的最重要课题。
一个人长期待在什么环境里,哪些行为会被反复奖励,也在慢慢改变他。
罗伯特·萨波斯基曾长期观察肯尼亚的一个狒狒群体。附近旅游营地的垃圾坑里出现了受牛结核杆菌污染的食物,群体里那些攻击性强的雄性狒狒反而先吃到,后来约 46% 的成年雄性死亡。余下的群体中,雄性之间的攻击行为减少了,理毛等亲和行为增加了。更有意思的是,几年后原先的雄性陆续离开,新迁入的年轻雄性也逐渐适应了这里的相处方式。这个故事常被概括成「环境塑造个体」,但我觉得它还多说了一件事:既然一种群体文化能够延续,它也就可能被改变。只是改变有时来自一场谁也不愿经历的断裂。
做大模型训练的人对这种机制并不陌生。一个系统反复奖励什么,模型的行为就会朝那个方向移动。人当然不能被简单地理解成另一种语言模型,但这个类比还是让我有些不安。科研生活也有自己的奖励信号:论文、实验进展、清楚的故事线,以及一个问题能否继续变成下一个问题。待得久了,我越来越自然地向这些东西靠近。不过人和模型之间毕竟还有一道缝隙。人能够察觉奖励正在对自己做什么,也能够感觉到自己为此丢掉了什么。也许感受力的意义,不只在于让我被一首诗或一座城市打动,它还让我知道,自己正在被怎样的生活塑造。
这些年我确实建立起了一套更可靠的做事方式。实验与预期不同时,就拆开假设,寻找排查路径;计划失控时,就重新估计范围和优先级;连情绪不好时,我也会习惯性地寻找原因,看看是睡眠、压力、进度,还是某段关系出了问题,然后尽快把自己拉回原来的节奏。这套方法救过我很多次,它让我不再轻易被一次失败拖走,也让我第一次有能力在同一个问题上停留得足够久。
我有时把这一年的变化叫作扎根。过去的生活给了我很多方向,真正往下挖却需要稳定,需要允许一个问题长期没有答案,也需要承受重复和缓慢。现在的我比以前更能做到这些。但「扎根」又是一个太方便的词。只要一段时间没有结果,我们就可以想象根正在地下生长,好像所有的沉默最终都会得到解释。事实并没有这么整齐。有些时间确实在积累结构,有些只是回避,有些路走到最后也不会开花。
所以我暂时分不清,自己是在变得稳定,还是变得迟钝。同一份证据似乎可以支持两种判断:我不再轻易被挫折击倒,也不再像过去那样容易被一些无用的东西吸引;我终于可以把一件事情做深了,却偶尔会忘记最初为什么想做它。也许要等更久以后,回头看这段时间留下了什么,才知道地下发生的是生长,还是沉默。
让我把脚丫搁在黄昏中一位木匠的工具箱上。