2023 年刚刚过去,经历了一些思考,焦虑,与释然。
本职学术碎碎念#
在 2022 年末,之前最主要的一项学术工作遇到了职业态度不佳的审稿人,导致平白耗费了自己与合作者的不少精力与时间,让我产生了一些持续的自我否定与虚无感。虽然在之前了解也经历过类似的事情,但是这次的离谱程度还是远超了预期:一位同业者拖延了将近一年后给出了 “这篇「形容词 A + 名词 B」的工作不符合「刊物 of 名词 B」的 scope” 这样的评价。
于是在这篇工作初稿完成后的第二年,我们顶着相关领域技术爆炸式发展的背景进行了修改与重投,终于在 2023 年的末尾得到了接收,在这里也要特别感谢导师与合作者在工作上的肯定与支持。
虽然其他几项主导和合作的工作没有那么顺利,但是这些其实都没有过于超出预期。也许研究者的宿命就是在自信满满 - 自我否定这个山坡上寻找平静人生的鞍点。博士阶段很可能是最后一段能够完全专注在一项研究上的职业生涯,希望我在未来能够增强自己多线并行工作的管理能力。
游手好闲碎碎念#
时间一下子就快进到了潜在的学界生涯的末尾(也许),也开始频繁收到猎头的邀请。从我的身边统计学来看,今年招人最急的方向是多模态大模型与量化交易。
基于对国内金融市场成熟性的判断,我没有对量化市场继续深入了解,但多模态大模型的工作倒是一篇篇地砸在脸上:从 BERT 到 LLAMA,从 ViT 到 Diffusion,从 MoE 到 RLHF。做一些基础机器学习理论方法研究的我被问到有没有大模型经验时还是会感觉蛮奇怪的,毕竟我的工作经历都写得很清楚,一些基础 ML 理论,一些 AI+Web3 的 PoC,也没有 OpenAI 或者 MetaAI 的工作经历(笑)。可能这就是隔行如隔山,我们总会把自己领域内的知识看得过于常识,而把一些真正需要掌握的生活常识看作古神低语。
在今年的会议上看到了大量做 LLMs 的 Prompt 或者 Tuning 的工作,总让我有一种手工业者面对珍妮织布机优化问题的感觉。信息的获取,检索,与分发一直是互联网的核心功能,我们现在的技术积累,治理规则,与道德标准真的已经准备好迎接这一场大变革了吗,我不好说,但这个问题一定会长久的持续下去,毕竟 Ilya Bengio 这些学术界里头最聪明的人现在也只是刚开始摸索。
业余生活碎碎念#
2022 年我在微信读书上读完了大约五十本书,今年没有看统计,肯定会少一些,但是看了更多的自己研究方向以外的文章,博客,和实体书,总体的阅读量差别不大。
因为之前做了推荐系统相关的工作,因此今年继续坚持了 “自己决定信息获取” 这样的事,很少花时间在软件平台提供的推荐信息流上,也没有下载短视频软件。我们宝贵的时间和注意力不应被作为商品消耗,尽量。
Machine is Learning,Humans are Hooked。这并不是我们机器学习研究者为之努力的未来,一个反乌托邦的赛博朋克故事。今年还玩了赛博朋克 2077 的 DLC,亲手把百灵鸟送上了月球,就像 V 和 Rebecca 一样。EVA,攻壳,2077,生化奇兵的故事在那个瞬间串了起来,而月球就是那名为希望的微弱的光芒。
然后,在 2023 的末尾,我到达了月球 (To be continued)。