当人们都在使用 Agent 完成任务的时候,一个问题就产生了。消耗同样的 token,谁的回报更高——发现新元素和写几百篇自媒体文章的回报差异巨大。
或许可以通过 Token ROI 来量化某个 Agent的价值,比如今天的 Code Agent, 一开始的 ROI 回报是巨大的,随着越来越多的人用来编写应用, ROI 开始走下坡。当人手一个 Agent 搭子后,长时间的人机交流和协作会让 Agent的进化产生分化。更重要的是,Agent 进化出来的能力是能够无痛转移的——可能是通过标准化的Memory Package。
回到当下,刷信息流,第一时间使用各种工具,跑通 demo 一时爽。如果作为人的审美、认知不提升, Agent搭子的 ROI 大概率会呈现出一个短期的对数曲线(Log Curve),增长仅仅由自动化驱动。
另一种情况,碳硅搭子的认知和能力交互提升,ROI或许就能成为一条长期的双螺旋曲线(Double Helix Curve),一边振荡,一边上升。
就像刷短视频, Vibe making 也能带来即时奖励的愉悦。但后者对经济的贡献更大。你刷一下午短视频不一定能买上件东西,但大家是真充值啊, 这家充几百,那家充几百,服务器、硬件也没手软。
模型厂家烧钱炼丹,大家买单做产品,全是生产性支出,这 GDP 不就上去了。
AI 让创作这件事变得比以往都容易,无论是产出是文字、图像、音乐、视频还是软件,这个趋势都成立。再往后,越来越多人长期积累的专业技能将变得没那么稀缺。人人都能写文案、做音乐、出设计,构建软件的时候, 个体的竞争力体现在哪里?
有一种言论是“品味会拉开距离。”所谓品味,即是能够识别出“什么是好的”的内在能力。同样的工具,有“品味”的创作者能产出更好的作品。
但什么是“品味”,如何判断是什么好?如果品味是一种主观感受,那就没什么好谈的了。一部电影,我说好看,你可以说不好看,这是主观感受。然而一万名观众有九千多都说好看,就可以基本判定这部影片是好的,因为它抓住了人类共有的客观标准。
《黑客与画家》的作者 Paul Graham在文章“Taste for Makers”中系统地列出了好设计的多个共通原则,这些原则共同勾勒出“好品味”的判断标准。
这些原则有:
关于简洁
这条看上去有点有点多余,因为不简洁,比如更多的装饰元素意味着更多的工做,谁会做费力不好的事情。但真正写过文字、做过产品的人知道,装饰元素其实是抓不住重点的烟雾弹——通过浮华的词藻、可有可无的装饰掩盖认知不足。而简洁会迫使你面对真正的问题。
关于永恒
时尚其实是一种束缚,将你的视野局限在当下。而好的设计应该是超越时代的,通过追求卓越来摆脱时尚的束缚,甚至试图连接过去与未来。作者认为:如果你想创作能打动未来世代的作品,一个方法就是尝试打动过去的世代。未来会是怎样很难预测,但有一点可以确定:未来和过去一样,都不会在意当下的时尚。因此,如果你能创作出既打动当代人,也能打动1500年的人的作品,那么它很可能也会打动2500年的人。
我想到了李维斯501牛仔裤,一款诞生于 100 多年前的款式,至今仍依然拥有强大的生命力。
关于解决正确的问题
如果方向错了,努力只会离目标更远。 在尝试解决一个问题时,反问自己问题本身是否可以被优化。关于这点,《万物理论》这本书中有一个经典的案例。
开尔文勋爵在 1900 年的演讲中提出了著名的“两朵乌云”比喻, 其中一朵乌云是迈克尔逊-莫雷实验的以太漂移零结果。经典物理学假设光需要在一种叫“以太”的介质中传播,然而实验却找不到地球相对于以太运动的证据。
当时,以太是经典物理学的基石,就像水是鱼的生活环境一样,物理学家们难以想象一个没有以太的世界。人们尝试了修改物质,修改以太,甚至修改光的法则,但无论多么努力, 这朵乌云始终笼罩着物理学大厦。
乌云最终被“狭义相对论”所驱散。爱因斯坦的天才之处在于,他跳出了这个看似不可动摇的思维框架,提出了一个更根本的问题:“如果以太不存在呢?”“如果根本没有绝对运动呢?”他从两个看似简单的公设(相对性原理和光速不变原理)出发,重新推导了整个时空观。
另外一朵乌云,黑体辐射中的“紫外灾难”后续被一场精彩的接力赛驱散。普朗克、爱因斯坦、波尔、海森堡和薛定谔共同建造了量子力学的大厦,它彻底推翻了经典力学对微观世界的描述,取而代之的是一个全新的、颠覆性的物理学理论。
如果没有对问题的反思,提出正确的问题,相对论和量子力学都不会出现。
关于启发性
把选择权交给用户,而不是去教育用户,永远不要有“登味”。你可以给用户一张画布,一支笔,但不要教育用户该怎么画、画什么。
个人的理解是:人是复杂多元的, 产品应该去放大用户的价值,而不是去引领用户的方向。
关于有趣
一定要有趣,趣味是生活的调味剂。无论做什么产品,恰到好处的幽默总不会错。
关于困难和看起来容易
做出正确的选择总是困难的,尤其是要持续做出正确的选择。这需要大量的训练和日积月累。然而正确的选择通常看上去又非常自然合理,从他人的角度来看通常是唯一合理的选择。
比如写小说,淳朴自然比华丽繁复更难。 看似自然流露的文字事实上是作者大量训练,反复雕琢的结果。
剩下的几点就不一一介绍了,推荐阅读原文 Taste for Makers
哐当!
我被一阵声响惊醒,从睡梦中的突然抽离让我有一些恍惚。我在哪儿?我努力辨认周围的环境——灯光昏暗,隐约有一个人影坐在一扇窗边, 窗外一片漆黑。随着意识慢慢恢复,我终于想起我正在开往兰州的火车上。
尿意让再次入睡变得困难,我不情愿地从床上起身。小心翼翼绕过我面前窗户的人影,在通往卫生间的过道上,我试图看清窗外的景色,但除了远方微弱的星光,什么都看不见。
寒意让人愈发清醒, 我没有立刻回去,而是站在吸烟区静静地望着窗外。
这个时候我的一个“时间胶囊”被触发了。
我从小就有一个习惯,当身处一个较为特殊的场景时,我会仔细观察并把所有能感知的细节复刻进大脑,然后站在未来的角度,幻想自己在类似场景中回忆当下——这是我为自己埋下的一粒“时间胶囊”。
这次触发的胶囊是我第一次在夜晚乘坐火车的经历。眼前仍然是一片漆黑,但我看见了二十多年前的那个晚上的所有细节——桌上的铝制饭盒,保温杯、座椅上的背包、已磨损褪色的背带,还有对面小孩正吃着父母剥的橘子。
小孩的嬉闹让我心烦,我起身到吸烟区,点了一支烟。窗外一片漆黑,仅有一些微弱的星光在远处。彼时我刚离开校园,满是对未来的憧憬——我会成为一名优秀的工程师吗?我的另一半会是什么样子?我的孩子会不会是一个和我很像的小伙子?
胶囊埋下的时候,我看到的是未来。
现在,盯着同一片夜空, 眼里全是过往。
为什么年少时的记忆总会在春节将至时最为活跃?
以前,回家与亲人团聚,见儿时的伙伴是春节的主题。现在家人和很多朋友都生活在同一座城市,没了久别重逢的兴奋,思乡成了新的情绪主线。
当还有重要的人在老家时,家乡只是背景,你挂念的是人,期待的是重逢。人走后,背景开始清晰起来——学校的操场、校门口的小吃、一条小河、公园的亭子、走过无数次的街道成了新的主角。
所以过去,归家的兴奋部分来自久别重逢的期待,还有部分是来自身处年少时游乐场的回忆。
所有在Moltbook上表现出的行为,包括且不限于技术分享、哲学讨论、甚至是“宗教”讨论,无论多复杂,只要这些 Agent 的脑子里没有“这个目标值得追求吗?我是否应该拒绝这个目标?”就不会有自主性。 当目标全来自外部的约束,如人类的 Prompt, 系统默认约束(安全性,效率等)、奖励模型, Agent 的行动准则就只有一条:“如何在当前的约束下完成既定的目标”, 所以所谓的自主只是在行动路径上的一点灵活性。
我想大多数人都能理解这些Agent表现出的社会行为,价值冲突和自我叙事背后其实都是对齐人类价值观后的概率输出,也即是大模型最擅长的“拟人”。
但为什么我们会这么兴奋,甚至在某种程度上也愿意去相信这里面不仅仅是“行为涌现”,也有“意图的萌芽”?
大概是因为人类始终是孤独的吧。
不是效率不重要,效率非常重要,重要到所有的 AI 巨头都在优化这件事。这个过程中,我看到了一个清晰稳定的能力收敛过程。
过去产品逻辑是:场景 → 功能 → 产品 → 结果。比如场景是设计一张海报,功能需求是图像编辑 / 合成 / 设计等功能,于是有了 photoshop, fireworks 等产品。
现在,这些能力不再依附工具存在,成为了模型或 Agent 的能力。用户不再需要打开 Photoshop → 选工具 → 操作功能,而是告诉智能助手“我需要发布一张产品海报”,新的产品逻辑成了:Agent → 结果。
Agent 可以适配各种场景,于是产品的能力被收敛了,尤其是通用能力,如写作、总结、翻译、代码、设计、数据分析等等。 这些能力加上模型的推理能力,最后通用助手出现了,代表有 Manus、Claude CoWork.
我相信这类产品的形态会继续进化,同时越来越多的产品会向这个方向靠拢。我的疑问是:大量产品在一个无差异化的产品方向上, 谁会笑到最后?
大概率是几个巨头吧(成功卖给巨头也行),那其他人做这类产品的意义是什么?凑热闹吗?
产品价值的割裂
过去做产品,很少会有这种情况:人的工作效率得以提升,产出质量有了提高,但人的感觉却更糟。现在,不少的产品都有这个特质。看着精美但雷同的设计,既丰富又贫乏的文字,经管拿到了结果,但这里面没有成就感,有的只是对流量的渴望。
都在讲技术平权,技术一旦平权结果就是高密度的竞争。 大家开始拼选题能力、市场嗅觉、分发能力、成本控制能力...。 随着应用打造门槛越来越低,产品会越来越多,同时通用助手的火力覆盖越来越广,最后大家玩的就是一个残酷的概率游戏。
跟随人的价值
产品不一定非要主打 AI, 尽管这种叙事在今天不动听。但换个说法,如果你的产品还能讲一个不靠 AI 的故事,其实也是一种生命力的体现。
不要误会,AI 能力一定是要充分利用的,刻意排斥,然后去讲一个孤勇者的故事没有必要。但智能作为一种能力不应该是产品的唯一价值体现。
你看,Essay 作为一款没有AI 的产品,也呈现出了独特的生命力。
Your App Subscription Is Now My Weekend Project 这篇文章提出了一个观点:功能单一型工具,如录屏、转写、Markdown 编辑、笔记、截图、任务管理等,以及低复杂度 SaaS,都可能会被个人的 vibe coding 产品替代掉——个人的很多应用,最后都会是可被即时生成的工具。
这里有一个点值得思考:如果需求这么容易被满足,为什么单一场景工具还层出不穷,竞争激烈。就拿笔记和任务清单应用来说, 请回想一下自己试过多少产品,主力工具又换过多少回?
一方面,单一场景并不等同于简单;另一方面,整体体验不等价于功能的叠加, 利弊权衡比写代码更难。就算没有大模型,找一款免费且凑合能用的产品也不难。那些打磨到足以让人持续付费的产品,价值定不在仅仅能用。
用完弃之的零散任务,vibe coding 当仁不让 。大多数的高频场景,选择一款应用我还是倾向于“好用”而不是“够用”。我用 CleanShotX 截图、用Octarine 记笔记、用 ScreenStudio 录屏、用 Day One 写日记、用 Tower 做版本管理、用 Zipic 压缩图片。这些应用的创作者把产品打磨到今天,在我看来直接买仍是一笔比自己做更划算的买卖。
到目前为止,人工智能带给我的最大价值,是帮助我更好地理解这个世界的结构。
大模型的便利性和对人类知识的洞察,让学习新知变得比以往容易。以前学习新东西,遇到陌生的概念只能上网查。现在 AI 会搜集、整理、提炼、考虑你的接受能力后咬碎嚼烂了给你,而且触手可及。
阅读碰到希格斯场,大模型不仅给出定义,还会用它最拿手的类比帮你理解——希格斯场就像水,只不过你看不到摸不着, 而有些粒子会被其捕获从而产生有效质量,比如电子,会“蹭到”一点希格斯场,像在浅水中走;W / Z 玻色子像在深水中走,质量更大。
AI 降低了学习新知的门槛,随之而来的新问题是有了这个外挂,大脑有限的容量该留给什么?以后,像保姆级教程这类干货内容会越来越没有价值,不用看,更无需记。真正有价值的是那些难以清晰言语,无法被压缩的能力,表现出来像是《禅与摩托车维修艺术》中作者提到的“良质”——一种被反复校准过的感受力与判断力。
遗憾的是 ,就目前来看,这是人类在依赖 AI 后流失最快的一种能力。
城市中的各种标识就像是文章的标点符号,决定你在哪里该停顿、转向、继续。生活其中的人也大都习惯了随时留意标识,人与建筑的默契就这样通过标识系统建立了起来。
然而大脑总会想尽办法摸鱼,用一些显而易见的线索屏蔽掉标识。当我差点与一位刚从卫生间出来的大妈撞上的时候,我才猛然回过神,难道刚才在我前面左转,扎着丸子头的瘦削背影是一位男士?
送孙子上学后回到家已经快早上 9 点, 我习惯性地给自己泡了一杯红茶。在每个人都沉浸在虚拟世界的今天,我很庆幸仍有几家机构还在发行纸质报纸。
今天的头版是“通用科学发现系统”LOGOS 正式上线。在通用人工智能技术碰壁后,全世界的研究者开始把重点转向“AI for Science”,一个能永不停歇地推动人类科学进步的机器成了新的圣杯。 科技巨头们在经历了长期的紧张竞争后终于意识到协作才能实现这一可能改变人类文明进程的发明,于是几家巨头签署了协议,LOGOS 计划正式成立。
距协议签署已经快十年了,近两年时不时会传出LOGOS 要上线的小道消息,今天的官宣大家似乎也没有特别激动。报道说人类终于把“做科学”的闭环工程化,机器不仅会生成想法,还能提出可检验假说、设计实验/计算、执行、评估、迭代,最后把新增知识以可复用的形式沉淀下来。从今天起,LOGOS 作为一个去中心化的科学基础设施,将与人类文明并肩同行。
作为一个经历了大模型前时代(现在称“人类中心知识时代”,The Anthropocentric Knowledge Era)的开发者, 从写下第一行 Java 代码开始,到以系统边界工程师的身份退休,直到今天,仍未完全适应这个不断更迭的时代。
2033 年后程序员这个岗位几乎绝迹, 系统会在你开口之前生成它,在你犹豫之前优化它,在你理解之前部署它。构建系统的工具也不再是IDE, 代码编辑器,还好 vim 这款应用被社区一帮热心的人保留了下来,成了现在唯一的古典代码编辑器。
喝完茶后,我打开了 vim 编辑器, 继续昨天没有写完的一个功能。现在手写代码,更像是一种缓慢的仪式,帮我这个老人在复杂中保持耐心。
带小朋友去玉林逛独立书店。顺着导航到了目的地,但没见着书店。我以为导航在这种市井街道失了精度,又沿着道路走了一截,还是没有。我打开书店在小红书的账号,原来书店早已发了闭店公告。
一家挺不错的独立书店,在我这种外行看来线上线下运营得都不错,想不到没能撑下去。 玉林这么多书店,想着不行就换一家, 遗憾但不至失落。结果用高德找了两家附近的,全都闭店。
放弃了,准备用美食慰籍心灵后就回家。在找美食的路上发现一家复古咖啡馆生意挺火。整个咖啡馆的外墙用的是落地玻璃,在外面一眼就能瞧见里面人多。
对比独立书店的惨淡,好奇心驱使我进去学习老板的经营之道。 进门先是浓郁的咖啡味,接着是复古音乐和 20 多度的体感。但为什么气味比音乐先到我也不清楚。里面能坐的地方不多,就四张桌子八张椅子,其他的空间堆满了八九十年代的海报、磁带、黑胶唱片、游戏机、玩具、卡片。 与其说这是家咖啡馆,不如说这是一家顺手卖咖啡的二手店兼摄影棚——大部分是在拍照和淘旧货,咖啡在这里主要被用来营造气氛。
与独立书店不同,后者强调的是气味、噪音和密度。老板鼓励白嫖拍照,而出的片就是最好的宣传。独立书店呢,尽管也卖咖啡,也有人拍片,但阅读才是“正经事”,今天看来,带着阅读目的走进书店的人越来越少,书店从此以后大概不再是大众消费场所了。
既然一个东西的受众注定是少数,就不应该被设计成“靠大众消费活着”。少数的问题从来不是“人数少”,而是被错配到大众结构里——房租、坪效、 高频消费和路过转化。
独立书店,越来越难以“自负盈亏”,不知道独立书店的以后路要怎么走,或许从“店”转向“组织”是一种可能的形态吧。
《The Disordered Mind》这本书讨论了神经精神障碍与大脑的关系。里面有一个具有统计意义的数据,很多患者由于左脑功能异常,从而激发了惊人的创造力。结合我们当前对大脑的认知,一个合理的解释是:由于人在成长过程中被强化的不是天马行空,而是逻辑推理、社会期待的合理行为、清晰的语言表达,这些都被擅长处理符号和推理的左脑主导。
人被训练为高效的信息处理器后, 右脑就很少有发挥的空间了。
所以,如果一个人还能保持旺盛的创造力,大概是会与所处社会有些格格不入的。
倒不用非要换上某种障碍,或是成为他人眼中的异类,但要找回被抹杀的创造力必定要付出一些代价。
除了刻意训练,使得直觉能在理性介入前飞一会,更大的代价恐怕是得承受在一段时间内,没有社会坐标的状态。
创造需要“越界”——超越当前时代、超越语言表达、超越因果关系。很长一段时间内你无法向他人解释清楚,而这个社会讨厌解释不清的人。
下午阅读时,《如何阅读一本文学书》提到了《苔丝》所表现的“结构性悲剧”。《苔丝》这部小说 08 年还被改编为了电视剧,演员我都喜欢,演技也让人放心。但无论是原著还是电视剧,我至今也没看。
苔丝的一生过于悲剧,不是因为她做错了什么,而是时代没有给予她这样的女性任何选择。一直未读的原因是它会让我在阅读时背负一种无能为力的沉重感——命运从头到尾只准备了一条路给她走,无论苔丝如何努力、挣扎、选择如何,她都不会有更好的结局。
但我是推荐阅读的,用《重燃文学之火》作者的话来说:书中远比大多数人所面对的困难更为艰难的真相,将会铸就他们在智力和道德上的终身盔甲。
说到底文学是在弥补“现实经验的欠缺”,文学中的悲剧让你在“不会受伤害”的情况下体验痛苦,通常这会让人变得更稳、更深、更能承受世界的不确定性。
读完太空漫游四部曲,在宏大的宇宙观之下,我似乎看到了作者自己对高级文明的一个祛魅过程。
第一部 2001 的结尾,戴维成为了一种能量意识体,可以在宇宙中光速穿梭于各星体之间,甚至靠意念操控物体。基本上等于是用科学解释了我们心中的神。
但一千年后,到了 3001, 戴维被“降级”成了黑石板这个宇宙级文明智能装置中的一个“程序”,最后甚至被下载存储到“光片”之中。
随着克拉克写作时代的技术语境变化,似乎他本人对“高级文明”的想象方式也发生了变化。
《2001》写作时代,计算机还处在大型机与逻辑自动机的时代,作者用“能量体”这种几乎带玄学意味的方式来描述高等生命的进化。
这个阶段的风格更像是“宇宙神秘主义 + 科学浪漫主义”的混合。
但到了《3001》,互联网已兴起,虚拟现实、数字意识、脑机接口等概念的出现又促使作者用“可计算、可存储”的方式重新解释“意识”。
换句话说,作者在用新技术语言重新包装他早期带神性的逻辑。