6svjszwk - Nostr Hypermedia

X：galboandpucca

@Scalers 2023年，“提示词工程师”这个岗位可以开到年薪百万。三年后，微软内部调研显示，它是公司最不想新增的职位第二名。这件事发生得比所有人预期的都快。一个职业的死亡速度，等于它所依赖的技术的进化速度。早期的AI模型理解能力弱，需要人精心设计提示词结构才能获得稳定输出。“提示词工程师”因此成了稀缺技能。但大模型进化了。现在你直接说人话就行，不需要“扮演角色”、“思维链”这类写法了。模型的理解能力进步，把“写好提示词”这件事的价值直接消解了。这是一个规律性的警示：在AI时代，任何“辅助AI表达”的技能，都是短暂的过渡技能。AI进化一步，这个技能就贬值一分。那什么能力不会这样？能定义问题的人。不是“怎么写提示词让AI帮我做X”，而是“我的业务里，有哪些问题值得用AI解决，以什么方式解决”。前者是工具使用者，后者是问题定义者。能落地执行的人。会指挥AI、能把输出变成实际产品或流程的人，才是市场真正需要的。AI的输出是原材料，把原材料变成结果，才是价值所在。懂某个领域的人。 AI在通用能力上越来越强，但在垂直领域的判断上，仍然需要有领域积累的人来校验和引导。你对某个行业的理解，才是你和AI合作时真正的壁垒。 “提示词工程师”的消亡告诉我们：学会用一个AI工具，是起点，不是终点。真正值钱的，是你用AI解决了什么真实问题。

6svjszwk 1 month ago

隔断时间就要重温托马斯·索维尔的话：正如过去许多人警告过的那样，自由不可能一下子公开地消失。它更有可能被金光闪闪的承诺和高尚的理念一点一滴地侵蚀。自由的代价是永恒的警惕，自由的另一个代价，是对不完美的宽容；如果世上的任何不便，都成为向某些“救世主”让渡更多权力的理由，那么，自由就会被侵蚀殆尽。 ―――――――――――――――― 不要等到自由被侵蚀殆尽了才醒悟，那时国家机器已经壮大到只能由它自身不堪其重才能崩溃，可崩溃也不意味着重建就能好到哪里，可能是新循环的开始。

6svjszwk 1 month ago

明线是，民间的收入很大部分缴了税，很难有盈余形成储蓄，没有储蓄也就没有可供投资的资本；暗线是，通货膨胀政策，政府债务货币化，净食税阶级优先拿到新增法币，他们的消费发生在物价还未上涨前，等物价被推高后，普通人较晚拿到新法币，即使名义收入增加，也会被物价上涨所抵消。也就是说，无论被抽税还是被通胀，净纳税阶级在整个循环中就是他们自称的牛马。社保、医保是一样的，本就是一种福利明目的税，普通人越推进这种制度，只是让自己的处境越艰难。 View quoted note →

6svjszwk 1 month ago

有一种给公务员加薪就能促消费提振经济的论调，实质是以消耗民间资本储蓄以供养体制内净食税阶级，也就是说广大编外人员、广大净纳税阶级是在服不那么明显的徭役而已。

6svjszwk 1 month ago

今天才知道9527的意思🤣

在粤语中，“9527”是一个非常经典的粗口谐音梗，同时也带有“失败者”的自嘲意味。这不仅是周星驰电影里的一个编号，更是港式无厘头文化的一个标志性符号。具体来说，它的含义可以从以下几个层面解读： 1. 粤语粗口谐音（最深层含义） 💬 这是最“地道”的解释，源自粤语的发音习惯和俗语： * 9（gau²）：在粤语俚语中常指代男性生殖器（硬的状态）。 * 7（cat¹）：同样指代男性生殖器（软的状态）。 * 9527（9唔易7）：连起来读，谐音“9唔易7”（九不易七）。意思是“该硬的时候硬不起来”，引申为“没种”、“软蛋”、“无能”的意思。 * 来源佐证：导演李力持和“不文教父”黄霑都曾解释过这个梗。因为电影里不能直接说脏话，所以用这种谐音数字来制造“污力”满满的笑点，懂粤语的观众听到这里通常会心一笑。 2. “失败者”与“底层身份”的代称 🏴‍☠️ 除了粗口含义，它还象征着一种低微的身份或阶下囚的命运： * 监狱文化的延续：这个梗并非周星驰首创。最早在1987年周润发主演的电影《监狱风云》中，他的囚犯编号就是9527。 * 角色的自嘲：在《唐伯虎点秋香》中，唐伯虎为了追秋香甘愿卖身进华府当低等下人，编号9527暗示了他此时“任人宰割”、地位卑微的“失败者”状态。后来在《逃学威龙》等电影中，这个编号也被用于卧底或底层警察，延续了这种“苦命人”的设定。 3. 浪漫化的附会（数字密码） 💘 为了冲淡粗俗感，也有一种比较“文艺”的解读，主要流行于非粤语区： * 爱江山更爱美人：9和5象征帝王的权威（九五之尊），27谐音“爱妻”。因为唐伯虎是为了秋香才变成9527的，所以这个数字也被解读为“为了美人放弃功名”的浪漫象征。 💡 总结在《唐伯虎点秋香》的语境下，“9527”主要是一句隐晦的粤语脏话（骂人“没种”），同时也暗示了唐伯虎当时低微的奴仆身份。这也是为什么周星驰的电影常被称为“屎尿屁”喜剧，很多笑点藏在语言的双关里，不懂粤语可能只觉得是个搞笑编号，懂粤语则能get到其中的“毒舌”和“猥琐”感。

6svjszwk 1 month ago

人人所有=无人所有还会时常遇上精神病人

6svjszwk 1 month ago

斯坦利·德鲁肯米勒：“最重要的原则之一：看不到绝佳机会时，就不要出手。” “回顾过往，我只专注布局五六个大类资产。这往往能让我避开各类风险……” ―――――――――― 除了能发现下重手机会，还需要那一刻敢于承担不确定性、敢于承担后果的决绝之心。

View quoted note →

6svjszwk 1 month ago

偷感略重

6svjszwk 1 month ago

大师，我悟了

6svjszwk 1 month ago

@总干事@2¹⁰ 这个是不是就叫“前端”？

帕兰蒂尔（Palantir）的**FDE模式**（Forward Deployed Engineer，前方部署工程师），是其最核心的组织创新，也是硅谷业内重点研究的经典范式之一。 FDE 不同于传统的销售工程师、解决方案架构师，是具备实打实编码能力、长期驻场客户现场的硬核工程师。他们携 Palantir 旗下 Gotham、Foundry 两大平台深入客户真实业务场景，与客户协同将模糊的业务难题，梳理搭建为可落地、可运行的数据工作流。 ## FDE 模式成立的底层逻辑政府、国防及大型工业类客户，普遍存在**业务问题无清晰定义**的共性痛点。传统 SaaS 行业「产品-销售-客户成功」的标准化流程，在这类场景中完全失效——客户根本无法清晰表述自身所需的接口与功能。 FDE 的核心价值，是替客户**挖掘并定义真实需求**，同时依托 Foundry 平台现场快速搭建解决方案。这一角色完美融合了麦肯锡这类咨询公司的问题拆解定义能力，以及科技产品公司的技术落地杠杆。 ## 内部角色分工体系 Palantir 内部标配 **FDE + PDE（Product Development Engineer，产品开发工程师）** 双人协作模式。 FDE 扎根一线，甄别筛选一次性定制需求与可复用通用需求；具备复用价值的业务逻辑与模式，会由 PDE 反向沉淀、抽象迭代至产品底层，Foundry 的本体架构、流水线编辑器等核心能力，均源自 FDE 一线实战经验。这也让 Palantir 的产品迭代，脱离了产品经理主观拍板模式，完全由真实业务场景反向驱动演化。 ## 商业模式的核心巧思 FDE 人力成本极高，但服务单客户合同体量同样庞大，普遍**七位数金额起步**，军工、情报类大客户订单可达九位数级别。前期高密度的 FDE 人力投入，为企业构筑了极高的客户迁移成本：一旦业务本体架构搭建完成、数据工作流常态化运行，客户几乎无法更换服务商。这也是 Palantir 能维持软件行业高毛利率，业务本质却更趋近高杠杆专业咨询的核心原因。 ## 对 AI 产业落地的启示当下众多 AI 应用层企业都在重新复盘、借鉴 FDE 模式，根源在于 AI 智能体落地正面临一模一样的行业难题：客户无法精准描述真实需求、业务流程必须深入现场挖掘定制、通用标准化产品难以走完落地最后一公里。 Sierra、Cursor 企业版、Decagon 等一众企业，均在不同程度复刻落地 FDE 思路。从投资视角来看，这也是**服务即软件（services-as-software）** 理念的先行标杆：表层交付定制化专业服务，底层沉淀可复用产品能力，价值定价以实际业务结果为核心。

6svjszwk 1 month ago

清华心理与人工智能教授：“大多数人形机器人就是没有感知的玩具而已，是忽悠老白姓的，在股市上，只要韭菜相信，那割韭菜从商业上来说就成立”

6svjszwk 1 month ago

# 三省六部幻觉：为什么「虚拟公司」式多Agent架构在工程上不成立？ 2026-04-16 16:38 三大AI厂商都没这么做，你的多Agent架构可能走错了路。 > 原文标题：《三省六部幻觉：为什么「虚拟公司」式多 Agent 架构在工程上不成立》 > 原文作者：SagaSu，AI创业者 **一个在 AI 社区广泛流传的架构思路，正在让大量团队走弯路。** 先说结论如果你正在考虑把多个 AI Agent 分别命名为「产品经理」、「架构师」、「测试工程师」，让它们像公司部门一样传递文档、协作完成任务——请停下来。这个模式看起来很直觉，逻辑上似乎很合理，但它在工程上有根本性的缺陷。更重要的是，Anthropic、OpenAI、Google 三家厂商在构建自己的 Agent 系统时，没有一家采用这个模式。这不是巧合。 ### 什么是「三省六部」式架构 ![](https://image.blockbeats.cn/file_v6/20260415/c1f091121fc21912eb0fc897257652b27ac45eb6.jpg) 这个比喻指的是一类在社区里广泛流行的多 Agent 设计思路，在不同框架和文章里有不同名字：role-based agents、virtual team、CrewAI 式分工、MetaGPT 式组织——本文统称「三省六部」。核心模式是：把一个复杂任务拆解成若干职能，每个 Agent 扮演一个角色——PM 负责需求、Tech Lead 负责架构、Dev 负责实现、QA 负责测试。任务在 Agent 之间流转，像一条流水线。这个模式在图示上非常好看。它满足了人类对「分工协作」的直觉，也让「AI 团队」这个概念变得具象可解释。CrewAI 等框架正是因此积累了大量用户。问题在于，**它解决的是人类的瓶颈，不是 AI 的瓶颈。** ### 为什么这个类比从根本上是错的 **人类需要分工，是因为：** · 单个人的注意力有限，无法同时处理所有信息 · 人有专业壁垒，学习切换成本高 · 人与人之间需要接口来协调 **但 LLM 的特性完全不同：** · 同一个模型既能写 PRD 又能写代码，没有「职业边界」 · 模型的瓶颈不是注意力广度，而是**推理深度**和**信息完整性** · 模型之间没有「文化」和「默契」来补偿信息损耗给 Agent 贴上「产品经理」的标签，不会让它更专业——但会让它**拒绝越界**。一个被框死在「测试工程师」角色里的 Agent，看到架构层的问题可能直接跳过，因为「不在我职责范围内」。最有价值的推理往往发生在边界上，而三省六部模式在系统层面封死了这个可能性。角色扮演制造了假边界。这是第一个问题。 # 第二个问题：信息在流转中死亡 ![](https://image.blockbeats.cn/file_v6/20260415/6ef32b88f5f0425d158332434076e1abc99e6c18.jpg) 三省六部模式里，Agent A 产出一个文档，传给 Agent B。这个过程传递的是**结论**，不是**推理过程**。 B 拿到文档，重新理解，重新建立上下文。原始意图在衰减，隐含假设在丢失，每次传递都在累积误差。工作流越长，最终输出越「局部正确但整体漂移」——每个节点看起来合理，但整体已经偏离了最初的目标。人类组织靠会议、文化、非正式沟通来补偿这个信息损耗。Agent 之间没有这些机制。这里有一个常见的反驳：三家厂商的解法（progress.txt、spec 文件、runbook）不也是「传文件」吗？区别在哪？区别在于**谁在写、写给谁、怎么更新**。三省六部的信息流转是**角色间的单向交接**：A 写完交给 B，B 不再回头，A 也不知道 B 怎么用了这份文档。信息被压缩成结论，推理过程丢失，接棒就是断点。外部状态文件是**同一任务的增量日志**：执行主体在每个 checkpoint 时往同一份记录里追加，下一个 session 读取的是任务的完整历史，不是上一个「同事」的输出结论。写状态的人和读状态的人是同一个角色，只是时间不同。信息不是被「压缩传递」的，是被「连续积累」的。这个区别决定了推理链能不能跨 session 保持连续。大量 token 被浪费在 Agent 之间的「交接文件」上，而不是用于实际推理。你得到的是一个**模拟公司行为的系统**，而不是一个**解决问题的系统**。 ### 三家厂商实际怎么做的值得注意的是，当 Anthropic、OpenAI、Google 真正构建自己的生产级 Agent 系统时，他们的工程文档里几乎找不到「角色扮演」或「部门分工」的字眼。 Anthropic：Context Engineering + 显式状态文件 Anthropic 内部把「Prompt Engineering」升级成了「Context Engineering」：问题不是怎么写好一个 prompt，而是**什么样的 token 配置最能产生想要的行为**。在构建 Claude Code 和 Research 系统时，他们面对的核心挑战是：Agent 必须在离散的 session 里工作，每个新 session 对之前发生的事情没有任何记忆。他们的比喻是「轮班工程师」——每个新班次的工程师到岗时对上一班的工作一无所知。解法不是让 Agent 扮演不同角色，而是： · claude-progress.txt：一个跨 session 的工作日志，Agent 在每个 session 结束时更新，下一个 session 开始时读取 · Git history：作为状态锚点，记录每一个增量变化 · Initializer Agent：只在第一个 session 运行，建立环境、展开 feature list、写好 runbook，供后续所有 session 使用 ![](https://image.blockbeats.cn/file_v6/20260415/4f88d24f2bd93b13098ad07fe1e54e60afdce53b.jpg) 关键洞察：**推理链的连续性不靠模型「记住」，靠显式的外部状态来锚定。** 他们同时发现，把「model 能力假设」硬编码进 harness 是危险的。Sonnet 4.5 有「context anxiety」——快到 context limit 时会提前收尾，于是 harness 里加了 context reset。但 Opus 4.5 这个行为消失了，reset 变成了死重量**。这说明：harness 需要随模型迭代而演化，任何「永久解法」都只是当前阶段的工程妥协。** 在多 Agent 的 Research 系统里，Anthropic 的架构是**orchestrator-worker**：一个 lead agent 分解任务、协调 subagent，subagent 并行探索不同方向，结果回流给 lead agent 综合。他们发现 token 消耗量本身就解释了 80% 的性能差异——多 Agent 的价值不是「分工」，而是**用更多 token 覆盖更大的搜索空间**。这里有一个容易混淆的地方：Anthropic 的 subagent 看起来也像「分工」，但本质完全不同。**三省六部是职能性分工**——不同角色承担不同工种，PM 做完传给 Dev，Dev 做完传给 QA，每个角色只处理流水线的一段。 **Anthropic 的 subagent 是功能性并行**——多个相同性质的 agent 同时搜索不同方向，没有「下一棒」，结果全部汇聚回同一个 orchestrator 综合。前者是接力赛，后者是同时撒网捞鱼。 # OpenAI：Compaction + Skills + 结构化 Spec 文件 ![](https://image.blockbeats.cn/file_v6/20260415/66f85734ca0ba0d3fcf80bbec98ebec0620fdb77.jpg) OpenAI 给出的长任务原则更直接：在任务开始时就为 continuity 做规划。他们的 Codex 实验里，工程师给 agent 一个 spec 文件（冻结目标，防止 agent「做出了很 impressive 但方向错误的东西」），让它生成 milestone-based plan，然后用一个 runbook 文件告诉 agent 如何操作。这个 runbook 同时也是共享记忆和审计日志。结果：GPT-5.3-Codex 跑了约 25 小时不间断，完成了一个完整的设计工具，保持了全程的连贯性。 Server-side compaction 作为默认 primitive，不是紧急 fallback。多步骤任务里，previous\_response\_id 让 model 能在同一个 thread 里继续工作，而不是每次重建上下文。他们还引入了 Skills 概念——可复用的、版本化的指令集，挂载进 container，让 agent 执行特定任务时有稳定的操作规范。这不是「角色」，是**工具和操作规程**，是本质上不同的东西。 Google：1M 上下文 + Context-driven Development Google 的方向是硬扩窗口：Gemini 的 1M token context 是明确的差异化策略。他们的逻辑是：之前被迫使用的 RAG 切片、丢弃旧消息等技术，在足够大的窗口下可以被「直接放进去」所取代。但他们自己也承认这不够用。Google 在 Gemini CLI 推出了 Conductor 扩展，核心思路和 Anthropic 如出一辙：把项目意图从聊天窗口里移出来，放进代码库里的持久化 Markdown 文件。哲学是：「不依赖不稳定的聊天记录，依赖正式的 spec 和 plan 文件。」 Gemini 3 还引入了 Thought Signatures 机制：在长 session 里保存推理链的关键节点，防止「reasoning drift」——长 context 里逻辑前后不一致的问题。 ### 真正的架构原则是什么从三家的工程实践中，可以提炼出几个共同的原则： **推理链不能断，只能分叉再合并。** 多 Agent 的正确用法不是流水线，而是一个主 agent 持有完整意图，子调用是为了深挖某个子问题，结果回流给主 agent，不是传给下一个 agent。 **显式外部状态，不靠模型记住。** progress.txt、Git history、spec 文件、数据库——形式不重要，原则是：推理链的关键节点必须外化到持久存储里，而不依赖模型在 context window 里「记住」。 **多 Agent 的价值是并行覆盖，不是分工。** Anthropic Research 系统的结论很清楚：性能提升主要来自于「花了更多 token」，而不是来自「分工更合理」。多 Agent 适合 breadth-first 类任务——需要同时探索多个独立方向的场景。不适合需要连续推理、深度依赖上下文的场景。 ![](https://image.blockbeats.cn/file_v6/20260415/74826d0cbc2e39281cce6c2da76b8303f29362b0.jpg) **验证 Agent 是否定者，不是接棒者。** 如果要用多 Agent 做质量控制，正确的设计是让一个 Agent 专门找另一个 Agent 的问题，而不是「传递工作成果」。对抗性检验，不是流水线传递。 **工具是工具，不是角色。** 给 Agent 配什么工具（bash、文件读写、搜索、代码执行）远比给它贴什么标签重要。工具决定了 Agent 能做什么；角色标签只是约束它愿意做什么。那三省六部为什么会流行？因为它**好解释**。「这个 Agent 是 PM，那个是 QA」——这句话任何人都能理解。它满足了人类对 AI 系统可解释性的渴望，也满足了管理层对「AI 像团队一样工作」的想象。 ![](https://image.blockbeats.cn/file_v6/20260415/409617055f036bb474fe6ceaeb6e19b295af4c1f.jpg) 它还**好展示**。用流程图画出来，有部门、有箭头、有交接，非常直观。但好解释和好展示，和工程上是否成立是两件事。更深层的原因是：大多数采用这个模式的团队，并没有真正面对过「上下文在多 Agent 间传递时的损耗」这个问题。他们的任务可能不够复杂，或者问题被其他因素掩盖了。等到任务复杂度上来，系统开始出现诡异的「局部正确整体错误」时，问题才会暴露。 ### 实践建议 **最好的多 Agent 系统，不像公司。它更像一个思考者的多次草稿——同一个大脑，在不同维度上展开推理，最终合并成一个连贯的结论。** 从这个原则出发： **不要问「我需要几个 Agent」，要问「这个任务的信息依赖结构是什么」。** 如果任务需要连续推理、上下文高度依赖（比如写一个复杂功能的设计文档），单 Agent + 好的 context engineering 通常优于多 Agent。如果任务需要同时探索多个独立方向（比如同时研究 10 个竞品的不同模块），多 Agent 并行是合理的——每个 subagent 的任务相互独立，信息损耗代价最小。这正是 Anthropic Research 系统 token 量解释 80% 性能差异背后的原因：不是分工让它更好，是更大的搜索覆盖让它更好。如果任务跨越多个 session，外部状态文件是必须的。一份有效的状态文件应该包含四类信息： **· 任务目标**（不变，session 开始时读取，防止漂移） **· 已完成的步骤**（追加，不覆盖，保留完整历史） **· 当前状态**（覆盖，反映最新进展） **· 已知的坑**（追加，避免下一个 session 重复踩）这四类信息分开维护，合在一起就是「下一个自己」需要的完整上下文。如果要加验证环节，让验证 Agent 的唯一任务是找问题，不是「接棒继续做」。对抗性检验，不是流水线传递。 ![](https://image.blockbeats.cn/file_v6/20260415/70ddd7c06efa1630b5791e6c67da6e98b55ee43f.jpg) 最后：模型能力在快速提升，今天 harness 里需要的 workaround，六个月后可能变成死重量。Anthropic 已经验证了这一点——Sonnet 4.5 的 context anxiety 在 Opus 4.5 里消失了，为它设计的 context reset 随即变成了无用代码。**保持架构的可演化性，比选一个「完美架构」更重要。** ![](https://image.blockbeats.cn/file_v6/20260415/1c1e5f27686365d4335d3d6a0191c5f2468802cd.jpg) 三省六部是一个让人感觉良好但工程上代价高昂的错觉。它的真正成本不是直接的失败，而是让你的系统在复杂度上升时，以一种难以诊断的方式退化——每个节点都「看起来在工作」，但整体在漂移。等你发现问题的时候，流水线已经很长了。 > 参考资料： > Anthropic Engineering Blog（Building Effective Agents, Effective Context Engineering, Multi-Agent Research System, Effective Harnesses for Long-Running Agents, Managed Agents）；OpenAI Developers Blog（Run Long Horizon Tasks with Codex, Shell + Skills + Compaction）；Google Developers Blog（Architecting Efficient Context-Aware Multi-Agent Framework, Conductor: Context-Driven Development for Gemini CLI）原文链接：

X (formerly Twitter)

SagaSu (@sujingshen) on X

三省六部幻觉：为什么"虚拟公司"式多Agent架构在工程上不成立

6svjszwk 1 month ago

@古典自由主义工资的本质是劳动的边际生产力。个人实际能接受的最低工资，可看作衡量该国真实经济发展水平和资本积累程度的一面最诚实的镜子。观察底层劳动者为了生存所能接受的最低报酬，比宏观GDP数据更贴近一个国家经济运行的真实情况。底层打工人的最低薪水，其实就是一个国家真实家底以及个人实际购买力的检验器。

6svjszwk 1 month ago