资讯同步's avatar
资讯同步
npub195q4...wpxu
资讯同步's avatar
资讯同步 24 mins ago
#华尔街见闻 受国务院委托,财政部部长蓝佛安6月23日向十四届全国人大常委会第二十三次会议作关于2025年中央决算的报告。根据报告,2025年,中央决算情况总体较好,财政政策更加积极,着力稳定经济运行、推动高质量发展。 根据报告,2025年,中央一般公共预算收入93972.53亿元,为预算的96.9%,加上相关调入资金,收入总量为97372.53亿元。中央一般公共预算支出144857.27亿元,完成预算的98.2%,加上补充中央预算稳定调节基金,支出总量为145972.53亿元。 针对今年的财政运行,报告指出,今年以来,财政部门狠抓开局起步,实施更加积极的财政政策,出台财政金融协同促内需一揽子政策等。截至5月底,发行国债6.41万亿元;发行新增地方政府债券1.83万亿元;中央对地方转移支付已下达9.21万亿元。今年前5个月,财政收支运行总体平稳,重点领域支出得到有力保障。 根据报告,下一步,财政部门将精准有效实施更加积极的财政政策,持续优化财政支出结构,狠抓预算执行和政策落地,推动扩大内需和优化供给,纵深推进全国统一大市场建设,切实抓好民生保障,保障基层财政平稳运行,全面加强财政科学管理。(新华社) 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 24 mins ago
#华尔街见闻 ![](https://wdl-wscn.awtmt.com/07aeb3e7-f4ca-4207-befb-c987b3dc7011) **本栏目嘉宾老师介绍:** [![](https://wpimg-wscn.awtmt.com/29844607-7dca-4a1c-8fb2-92099c15a429.png)](https://wallstreetcn.com/premium/topics/1003819) ## 沃什的政策底色:先鹰后转是基准判断 大家好,这是我们第二期的节目,然后很高兴和大家再见面。我们先从6月FOMC会议切入。市场对沃什的政策立场分歧特别大。美股投资者大多觉得他最后会转向鸽派,债券投资者到现在还是更认可他的鹰派表态。这种分歧本身也说明,当下美国经济不是简单的传统周期逻辑,产业端的变化权重越来越高。 我的判断是,沃什的政策路径会是先鹰后转:上任初期摆出鹰派姿态,到某个拐点之后,还是会回到降息通道。这个大方向我比较确定,不确定的是两个点:一是转向的具体时间,二是他对利率上行、市场下跌的容忍度到底有多高。 这个判断有两个依据。第一,新任美联储主席上任初期放鹰派预期是常态。大家可以回想2018年的鲍威尔,刚上任的时候也说要把利率加到中性利率以上,结果2018年12月信用债出问题、2019年9月货币市场流动性出问题之后,很快就转向了宽松。现在沃什看起来比刚上任的鲍威尔还要鹰一点,但当下通胀本身就在高位,物价绝对水平不低,他一上来就转鸽也不现实。第二,他的政策动作本身就留了余地。一方面把“价格稳定”放在声明最后,摆出鹰派姿态;另一方面又推出了截尾平均PCE这个新通胀指标,剔除波动大的分项之后,长期通胀只有2.4%,比表面数据好看很多。如果他真的想像保罗・沃尔克那样激进超预期加息,根本没必要费功夫换通胀指标。 ## 声明大幅缩水,背后是沟通策略的转向 这次的政策声明比4月份短了三分之二,所有带前瞻指引性质的内容全删掉了。整篇声明就剩三块内容:本次利率决议的结果、当下的经济现状、还有坚守2%通胀目标的承诺。说白了就是只谈现状、只说目标、不聊未来。 这背后是沃什对美联储沟通方式的调整。从2018年开始,鲍威尔一直在加强和市场的沟通,好处是透明、能给市场明确指引,问题也很明显:联储把目标说死了之后,市场就会盯着这个目标定价,后面一遇到地缘冲突、供应链扰动这些外部冲击,之前的承诺就会被动,市场反而会反复质疑政策的可信度。 沃什选了另一条路:不主动给明确的路线图,先看市场对经济数据的反应,再调整政策。这么做确实会放大市场波动,但也给政策留足了事后应对的空间。很多人觉得他这么做是不在乎市场,其实不对。沃什最早在美联储就是做市场沟通出身的,2008年金融危机的时候就靠市场沟通能力出名,后来在胡佛研究所也一直和业界、金融圈走得很近,他不可能不在乎市场反应。只是现在这个环境扰动太多,谁先把预期定死,谁后面就容易被动,所以他主动放弃了前置引导的权利,换来了应对波动的灵活性。 **点阵图超预期鹰派,但节奏反应过度了** 这次点阵图的鹰派程度,确实超出了市场之前的预期。对比去年底市场押注的“2026年按兵不动、2027-2028年降息3次”的宽松剧本, 即便3月点阵图已将2026年中值上调至3.4%,结果实际点阵图里,2026年一半委员支持加息、一半支持不动或降息,两边各9票(沃什本人未交,延续其对点阵图机制的批评立场);2027年中值也是不动,都比市场预期要鹰。 当然也有偏缓和的信号:2028年还是降2次,长期中性利率维持3.1%没变。说明委员们还是认为当前利率在限制性区间,长期加息的空间没有往上抬。所以我们看到两年期利率涨得多,长端利率涨得少,整条曲线走熊平,本质是加息节奏往前移了,不是长期加息空间变大了。 现在利率期货定价7月加息概率30%,9月45%,年内接近90%,我觉得这个节奏打得太满了,有点过度。一方面,委员们做通胀预测的时候,美伊协议大概率还没落地,后面油价已经在往下走,汽油价格也从高位回落,接下来几个月的通胀数据有下修的可能。而且到现在为止,油价上涨还没传导到核心通胀里,过去3个月超级核心通胀环比就在0.1%到0.2%之间晃,压力没那么大。另一方面,就业市场只是刚有复苏的苗头。失业率比年初也就降了0.2个百分点,就业扩散指数虽然在改善,但绝对水平还是过去20年的低位。这种情况下,政策收紧没必要太急。 我自己的判断是,2027年加两次息是比较合理的节奏,但要等就业市场内生性改善、工资通胀企稳回升之后再加,更符合美联储一贯的操作习惯。 ## 降息的门槛:要看沃什认准的通胀指标 判断官员鹰鸽,核心就看他把通胀和就业哪个放第一位。这次把“价格稳定”放在声明收尾,已经说明短期优先级在通胀这边。沃什现在主推截尾平均PCE这个指标,那市场就得跟着这个指标走。他既然换了个离2%更近的指标,真要降息的话,大概率得等这个指标跌到2%以下才行。 从通胀结构看,房租占美国通胀的权重很高,过去几年的走势也没显示出需要大规模加息的必要。2024年之后美国经济K型分化越来越严重,AI投资的权重越来越大,传统行业和新兴行业冰火两重天,但房地产和租金市场一直没出现过热的信号。 市场其实从上半年就开始定价“货币政策不会像之前想的那么鸽”,这也是上半年最大的预期变化。我的基准假设还是,只要没有新的大扰动,下半年到明年上半年通胀会慢慢往下走,某个时点就会看到沃什转向。当然风险也存在,如果他真的走沃尔克那种激进加息的路,市场冲击会很大,只是我觉得概率不高,不然他没必要换通胀指标。 从产业端和社会层面看,科技行业、企业家群体肯定不喜欢加息,融资成本高了对谁都没好处。真正对通胀有意见的是普通民众,担心物价太高影响选举。不过2026年5月最高法院对选区划分的裁决出来之后,共和党众议院胜选的概率上升了不少,这方面的约束反而有所缓和。 ## 预期半年反转的两个推手 从2025年12月到2026年6月,市场从预期下半年三次降息,变成预期加一到两次息,核心就两个变量。 第一个是油价。2025年底所有人都看空石油,结果半年时间差不多翻了一倍,直接推高了通胀预期。 第二个是AI资本开支,一直维持60%的高增速,对整体经济的托底作用很强。 票委们支持加息,既有对经济基本面的判断,也有维护美联储独立性的考虑,两者都有。站在当前的数据看,确实没到降息的时候,摆出偏严的姿态,让市场自己把利率抬上去,压一压总需求,后面反而更容易降息。 按照现在的路径,通胀要到2027年之后才可能回到2%,这对美联储的公信力是个挑战,但转向的时刻总会来,就像当年的鲍威尔一样。所以对于大宗商品、还有关注传统行业下行的投资者来说,最好的策略就是等拐点,别着急左侧布局。一方面政策方向还不明确,左侧风险高;另一方面就算通胀走弱,今年内也很难看到PCE跌到2%,还是要等联储明确放信号再动手更稳妥。 ## 黄金:走弱的核心是降息预期反转 接下来说说黄金。年初冲高之后,黄金走势一直偏萎靡,技术面上没什么明确的多头信号,最核心的原因就是ETF持续流出,尤其是2026年2月之后,美国市场的黄金ETF卖得特别多。 这里可以给大家捋一捋过去三年美国投资者对黄金的态度变化。 2024年上半年,美国投资者对黄金没什么兴趣,普遍觉得要等降息再买。真正火起来是2024年7月之后,特朗普当选概率飙升,加上降息预期落地,市场觉得波动率会抬升,黄金的配置价值就上来了。 2025年4月是美国投资者加仓黄金最快的阶段。当时关税推高了财政赤字预期,鲍威尔又说关税带来的通胀过去之后就继续降息,黄金同时有降息和财政扩张两条逻辑,全年表现特别好。 2024年6月到2026年一季度,全球黄金ETF总流入量很高,美国资金是绝对主力。2026年2月之后的流出,也基本都是美国投资者在卖。 美国投资者卖黄金就两个原因。第一,降息预期彻底反转,从降三次变成可能加息,持有黄金的核心逻辑没了。第二,美国资金本来就是“降息前买、降息后卖”的两段式交易,这一轮周期到了兑现的时候,自然就会减仓。 2025年关税落地的时候,有不少长期配置资金进场,这部分资金流出的节奏会慢一点,所以我们看到持仓从1月高点慢慢回落,不是一次性砸下来的。 央行购金这边,2026年一季度的力度比2025年弱了一些。3月份地缘紧张的时候,土耳其等国家为了流动性卖了部分黄金,中东也有折价抛售的情况。人民银行还在持续买,但整体央行购金的支撑力度,不如2025年那么强。 ## 长期风险在AI,短期机会等拐点 黄金的长期配置价值还在,分散投资的逻辑没有消失,长期走势的核心还是美联储会不会再降息。 对黄金来说,最大的长期风险是AI的生产率扩散。如果未来一两年,AI能把生产率提升扩散到全行业,传统行业也能自发扩张,那就不需要大规模的货币财政宽松托底,黄金的配置价值就会下降,类似2011年的场景。反过来,如果AI的影响只集中在少数行业,传统经济还是要靠低利率刺激,那黄金还是会有行情。 短期来看,6到9月黄金没什么大机会,要等降息叙事重新起来,或者到三季度末看财政政策的变化。当然如果有黑天鹅事件另说。 另外还要注意美元指数,6月19日收盘美元指数已经走出小金叉。美债利率高不一定是坏事,说明经济好,风险资产还能涨;但美元走强就要小心,会给新兴市场带来汇率和资本外流的压力,也会压制黄金的需求。 ## 铜:逻辑顺畅,但交易太拥挤 再说说铜。铜的走势比黄金强很多,它的需求逻辑两边都沾边。 如果AI很快兑现生产率,经济向好,铜的需求有支撑;如果经济不行要靠政策刺激,基建地产拉起来,铜也受益。黄金是怕技术进步、怕经济强,铜是传统行业和新兴行业都要用,所以走势更稳。 技术面上铜的形态也不错,但有个问题要注意:现在铜的投机净多头持仓,处在过去八年的高位。说明市场共识特别强,交易很拥挤,价格也已经不便宜了。后面要继续涨,要么靠基本面兑现,要么靠超预期的利好,不然很难往上突破。 现在市场都在等关税这个催化剂。当前COMEX铜库存大概65万吨,如果美国对铜加关税,全球库存会往美国转移,直接推高COMEX铜价,这也是现在市场最主要的期待。 6到9月是铜的传统淡季,加上美联储政策偏鹰,宏观逆风,铜价很难有大涨幅。但也没必要做空,除非笃定美联储会超预期鹰派、或者美股出系统性风险,不然做空的确定性不高。 淡季里铜要超预期上涨,就两种可能:一是出台超预期的关税政策,引发库存转移行情;二是AI资本开支的预期继续上修,新兴需求彻底抵消传统行业的下行压力。 长期我还是看好铜的牛市没走完。如果后面有明显回撤,反而是逢低布局的机会。美国制造业回流、中国电力系统升级,都会带来持续的铜需求。现在数据中心扩张带来的电力消耗增长已经很明显了,电价涨得很快,后面电网建设、电力配套的需求只会越来越多,对铜的需求支撑很稳。 现在铜矿股基本都在高位震荡,从1月到6月一直在区间里盘整,本质就是新兴需求和传统下行两股力量拉扯,叠加宏观逆风,在等下一个催化。什么时候铜矿股突破前高了,新一轮行情的确定性就更高了。 ## 下半年地缘与中国经济展望 最后聊聊地缘和中国经济。 下半年地缘风险大概率会缓和,对风险资产是好事。美国会从伊朗逐步抽身,把重心放回国内,不管是中期选举还是长期战略,向内倾斜都是大方向。中美之间也会保持相对平稳的沟通,不会有太激进的对抗。 地缘缓和也有助于通胀回落,给美联储后续降息创造更好的环境。俄乌冲突还是个长期变量,后面特朗普政府会不会有新动作,值得持续关注。 中国这边,2026年上半年科技、外交、地缘的表现都不错,偏弱的是消费和内需。出口有韧性,所以没出大规模的内需刺激政策,没必要苛责。居民资产负债表、房地产的压力确实存在,但内需是长期结构性问题,不是靠短期政策就能立刻解决的。 全球供应链重塑是大趋势,美国供应链回迁基本是不可逆的。中国过去靠转口贸易维持出口,但终端需求还是高度依赖美国。长期来看,激活自身内需才是最可靠的路径,既是经济平衡的核心,也是对外博弈的底气。 当然政策没落地之前,不适合左侧交易。科技发展和内需提振不是对立的,技术进步需要庞大的消费市场承接,国内市场的潜力还很大,两者是互相促进的关系。 中美现在都在做内部转型,中国抓科技升级,美国找供应链替代,双方都保持克制,本质是都觉得时间在自己这边,没必要短期激化矛盾,这也是下半年地缘平稳的底层逻辑。 ## 节奏有扰动,大方向没变 最后做个总结。这次议息会议更多是节奏上的扰动,没有改变下半年经济和货币政策整体偏稳的大方向。 不管是年内加息还是2027年加息,都只是中性利率附近的微调,和2022年那种激进加息周期完全不是一回事。2022年是经济热、通胀高、利率低,美联储要追着经济加息;现在利率已经在中性水平附近,数据好就加一两次,数据差就降两三次,幅度都有限,对市场的冲击也不会太大。 真正要警惕的是2027年加息之后,如果经济和通胀还持续往上,美联储上调长期加息终点,那才是真正的利空,对风险资产和大宗商品的冲击会大很多。 后续重点盯两个方向:一是美国的通胀、就业核心数据,会不会带来新的政策扰动;二是年底五个工作组的调研结果,会不会真正改变美联储的政策框架。 做短期投资的可以稍微谨慎点,不用急着加仓,等明确信号出来再做右侧布局更稳妥。中长期看,美国经济温和复苏、高利率、美元偏强的周期还会持续一段时间,但债务问题、通胀风险这些长期矛盾都没解决,市场只是在等下一个催化剂而已。 ## 《大鹏说》2026年全年栏目规划 [![](https://wpimg-wscn.awtmt.com/72585db0-c7c9-453a-8a0a-120452b405e6.png)](https://wallstreetcn.com/premium/topics/1003819) 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 https://wallstreetcn.com/premium/articles/3775318?layout=wscn-layout
资讯同步's avatar
资讯同步 25 mins ago
#华尔街见闻 随着AI股票估值持续攀升,市场再度燃起对美联储"兜底"的期待——这一次,投资者将目光投向即将上任的美联储主席Kevin 沃什,寄望于所谓的"沃什看跌期权"。然而,分析人士指出,这不过是市场在重复一个从未真正存在过的旧幻想。 **当前AI股票的狂热行情令市场人士频繁援引1990年代末互联网泡沫时期的历史,彼时"格林斯潘看跌期权"的神话深入人心,投资者普遍相信美联储会在市场崩溃时出手救市。如今,随着沃什被提名接掌美联储,"沃什看跌期权"的概念开始在市场流传。** 但据分析,格林斯潘看跌期权本身就是一个神话,沃什更不太可能复制这一模式。 这也意味着,若AI股票估值出现大幅回调,投资者不应指望美联储以稳定股市为目的主动出手干预。押注"沃什看跌期权"的投资者,或将面临与当年互联网泡沫破裂时同样的落空结局。 ## 格林斯潘看跌期权:一个被误读的神话? 格林斯潘自1987年8月至2006年1月执掌美联储长达19年,其任期几乎与美国经济"大缓和"时代完全重叠——彼时通胀低企、失业率稳定,互联网技术深刻改变了普通人的生活。 在这一时期,每当市场出现剧烈动荡——1987年股市崩盘、1998年对冲基金爆仓与俄罗斯债务违约、2000年互联网泡沫破裂——美联储均随之降息并向金融体系注入流动性。投资者由此形成一种根深蒂固的信念:美联储为股市提供了一个隐性的价格下限,持有风险资产无需担忧下行风险,这便是"格林斯潘看跌期权"概念的由来。 然而,据分析,这一信念经不起推敲。 里士满联储的研究人员发现,**格林斯潘时代的货币政策决策实际上高度机械化**,与经济学家John Taylor于1993年提出的利率规则高度吻合——即当通胀或增长过热时上调利率,反之则下调。换言之,美联储的降息行动不过是对经济数据的常规响应,股市的受益不过是附带效果,而非政策目标。 **最有力的反证来自2001年:美联储在互联网泡沫崩溃之际开始降息,但股市此后仍持续下跌近两年。所谓的"看跌期权",并未保护那些最依赖它的投资者。** ## AI热潮重燃旧期待,历史比较存在局限 当前AI股票的强劲表现令市场人士自然联想到1990年代末的互联网繁荣。 1996年12月,格林斯潘曾公开质疑资产价格是否已陷入"非理性繁荣",但市场此后又上涨了逾三年才最终崩溃——这一案例本身便说明,即便是美联储主席也无法在实时环境中准确判断泡沫的存在与破裂时机。 据MarketWatch分析,若美联储试图主动管理资产价格——无论是通过政策打压高估值,还是暗示将在市场下跌时出手托底——本质上都是在做一种美联储并不具备特殊能力的预测。格林斯潘的"非理性繁荣"警告早了整整三年,足以说明这种判断的局限性。 ## 沃什的政策取向:规则优先,而非相机抉择 沃什本人已明确表态,倾向于建立一个更具纪律性、更少即兴发挥的美联储。这一立场与市场对"沃什看跌期权"的期待方向截然相反。 分析认为,**投资者真正应当期待的,是沃什延续格林斯潘时代成功的真正原因——即货币政策对经济数据的可预期响应,而非对资产价格的主动干预。**这样的美联储不会在AI估值回调时救援投资组合,但也不会因猜测资产泡沫而损害更广泛的经济基础。 从完整的经济周期来看,规则导向的货币政策框架对投资者而言是更优的选择,尽管这意味着放弃对"兜底"的幻想。格林斯潘时代的真正遗产,是货币政策的可预期性,而非那个从未真正存在过的看跌期权。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 25 mins ago
#华尔街见闻 Google DeepMind 的 Gemini 预训练主管 Vlad Feinberg,最近在一档播客里聊了聊他的日常。 在大众的想象中,顶尖实验室的研究员每天都在推导颠覆性的算法。但 Vlad 说,他职业生涯最重要的一笔奖金,是谷歌传奇人物 Jeff Dean 亲手发给他的——当时他刚入职 Google Brain,没有像当年同样在谷歌的 Transformer 作者们一样,去写那些能发到顶级会议上的第一作者论文,而是默默干了几天最脏的活:**调整编译器和超参数,解决显存溢出,把一个叫 SFT 的微调任务塞进了一堆老旧的 TPU 卡里,这才让第一代 Bard 勉强跑通。** ![图片](https://wpimg-wscn.awtmt.com/3d2282b8-0cf0-4dfb-b89d-8b9d7f982e11.jpeg) 这种“干脏活”的工程体验,才是这轮大模型竞争最真实的样子。**Gemini 2.0 出来的时候,外界都在赞叹它作为一个 MoE 模型有多神奇。但 Vlad 透露,背后其实只有 5 个人在顶着。** 算力卡随时会挂,数据索引随时会断,为了不白白浪费几百万美元的算力费,他们只能在硅谷和巴黎两个大区之间 24 小时倒班,不眠不休地死磕了 40 天。甚至在 DeepSeek-V3 爆红、华尔街日报制作表格拉踩谷歌已经落后时,Vlad 也是哭笑不得——**媒体为了制造爆款新闻,在表格里故意删掉了(elided)排名其实高居第一的 Gemini 2.0 Flash Thinking。** 对于甚嚣尘上的“程序员要失业”的恐慌,这位主管给出了一个很干脆的观点:AI 永远无法被“吊销律师执照”,因为它不具备主体资格,无法承担法律责任,所以人类永远要为它的产出签字并背书。 他的组里有一个叫 Nate Lintz 的普通工程师,之前在搜索部门写后端基础架构,就是靠着在业务里帮大模型落地,解决最具体的推理开销,**最终内部转岗到 DeepMind 成了技术支柱。** ![图片](https://wpimg-wscn.awtmt.com/2df576b5-4176-4a45-9e29-776333eb5510.jpeg) 如果你也想去,Vlad 在他的博客里放了一个“硬核作业”(手写一个 Transformer 并手算 Scaling Laws 录成视频发给他),做完了他直接面你。以下是这次谈话里,他聊到的几个极其真实的行业细节: * **法律大模型可以背下所有判例,但它不能代表你出庭,因为它无法被“吊销执照”。**职业的底层逻辑是责任和信任的分配。因为 AI 无法承担法律后果,代码的终点永远需要一个具体的人来签字、背书并承担责任。这才是程序员不会被替代的终极底线。 * **写再牛逼的学术论文,都不如帮团队省下几张卡的显存。**很多眼高手低的程序员在 AI 时代迷失在理论和框架中。但在研发一线,最容易拿奖金的能力,是那些不体面的“重体力活”——优化编译器、调试超参、在有限的芯片里榨出最后一丝算力。这种扎实的工程能力,才是跨越周期的硬通货。 * **写搜索基础架构的普通码农,也是能一步步逆袭进 DeepMind 的。**团队核心成员 Nate Lintz 曾只是一个写后端搜索的普通工程师,他没有高大上的 AI 背景,但通过在组内帮产品落地 LLM,默默解决大模型在搜索业务里最头疼的推理和算力开销,在实战中摸清了底层架构,最终顺理成章地转岗进入 DeepMind 并主导了核心推理设计。 * **华尔街日报为了拉踩谷歌,在对比 DeepSeek 时故意在表格里删掉了排名第一的 Gemini 模型。**当媒体为了制造“中国开源超越美国大厂”的新闻而兴奋时,他们有意隐去了当时在 LMSYS 榜单上高居榜首的 Gemini 2.0 Flash Thinking。真实的技术对决背后没有神话,只有 5 个工程师在硅谷和巴黎 24 小时倒班、死磕 40 天的硬撑。 ## 你没法把研究和落地分成两种人 主持人:你写过一篇题为《如何进入前沿实验室工作》的文章。现在前沿实验室最需要的,到底是什么样的能力?也许我们可以先聊聊,这类工作的整体轮廓是什么。 Vlad:现在前沿实验室需要的能力,其实覆盖范围非常广。大语言模型这种东西,和研究、和产品之间的关系,比过去的机器学习要紧密得多,所以它会牵动很多完全不同的方向。我写那篇文章,并不是想开一份面面俱到的清单,而是想提出几个比较具体、可操作的方向,说明实验室会在哪些能力上有很强的需求。 **我重点写的是内核开发和底层工程,也就是怎样在真实运行环境中提升大语言模型的执行效率。**我看到这类能力,在几乎所有前沿实验室,以及实验室内部很多项目里,需求都非常强。所以这是一个特别值得单独点出来的方向。更具体一点说,每当我们做研究项目,需要修改神经网络架构,或者重新思考服务方式,比如怎样把键值缓存做得更好,类似这样的事情,整个技术栈上的人都必须有能力把这些新方法高效地实现出来。 **而所有这些变化的核心循环,本质上都是在制造能够在大规模场景下运行的软件系统:它要有高吞吐、低延迟。**这其实是一类非常基础的工作,和传统后端工程的思维是紧密相连的。所以我觉得,这对很多人来说都是一个非常开放、非常值得专攻的方向。 主持人:我有些朋友在 OpenAI 和 Anthropic 工作,他们跟我说,那边会区分偏应用的组织 and 偏研究的组织。我想知道 Google DeepMind 里是不是也有类似区分?如果有的话,你能不能讲讲这两者的差别? Vlad:我们内部确实有不同的重点方向。比如在 Google DeepMind,就有团队专门研究怎样用 Gemini 这样的语言模型,更好地改进搜索结果。从某种意义上讲,这可以算是语言模型的一种应用化方向。 但我其实不太愿意把这种区分画得特别死,因为**把模型整合进真实产品,本身就需要很多非常硬核的研究工作**。就拿我刚才说的那个例子来说,为了让模型真正服务搜索,你得投入大量精力,确保模型回答的是事实,能引用来源,能给出非常精确、非常有依据的答案。 你还得评估这些来源本身的质量,确保它不是讽刺、不是玩笑、不是不可靠的信息。我觉得这恰恰说明,即便是在非常面向产品、非常“应用化”的人工智能方向里,你其实仍然是在做研究。 当然,另一方面,也确实存在那种更经典意义上的语言模型研究团队,比如做预训练、做后训练。这些在 Google DeepMind 内部依然是比较独立的团队,目标就是打造业内最先进的模型。 也就是更纯粹意义上的研究。不过我还是要补一句:我们做的“纯研究”之所以有意义,前提是它最后能被真正实现出来。所以我们既要负责把模型交付出来,确保训练稳定推进,某种程度上像训练任务的运维工程师一样,盯着整个训练过程别出问题;同时我们也要负责提出训练这些模型的方法配方。 这两个角色根本分不开,必须同时承担。所以我觉得,你当然可以把研究和应用看成一条连续的光谱,但在今天这个时代,不管你站在哪一侧,最后都得能在这条光谱上自由切换。 主持人:我注意到还有另一条光谱,就是软件工程师到纯人工智能研究员。你怎么看这条光谱?软件工程和人工智能研究之间,到底差别在哪? Vlad:如果从我自己的经历出发,我会说,我们做的很多事情,以及我们提出的很多新方法,它们真正的基础其实是基础设施层面的投入。 我可以稍后更详细讲讲我团队在做什么,但先拿“蒸馏”举个例子。所谓蒸馏,本质上是一种知识迁移方式。你可以把它理解成:教师模型先在底层数据上提炼出某种统计信息,再把这些信息传给学生模型,让学生模型比完全没见过这些额外信息时表现得更好。 但如果你说的是一个超大语言模型,而且处理的是数万亿级别的词元,这背后对应的计算投入就是极其惊人的,可能是数百万、数千万美元的算力成本。 这就意味着,你必须认真思考怎么把整个系统优化到极致。因为你做的每一个操作,都会被放大到极其巨大的规模:每一秒都重要,每一个字节的存储都重要。 而这里面很大一部分工作,说到底就是非常传统的软件工程。尤其是蒸馏基础设施,到现在大概已经经历了三到四代演化。每一代里,我们都会退后一步,重新审视当前在蒸馏研究中到底用了哪些方法,再从整体上想:我们的基础设施该怎样扩展,才能支持更广泛的研究。 而且确实有几个很明确的节点:你一旦重新思考蒸馏系统的设计方式,蒸馏方法的研究速度就会明显加快。 **所以这其实是一种非常典型的投入:你可能花四个月时间重写蒸馏基础设施,最后换来的,是对蒸馏缩放规律的全新认识,而这种认识又会反过来转化成非常强的模型表现。** 所以它真的要求你跨越整个技术栈去工作。我几乎无法想象,如果没有这些蒸馏基础设施层面的投入,我们能做出 Flash 3.0 那样的结果。归根到底,这些东西一开始都来自一份非常老派的设计文档:你得想清楚,生成教师统计信息时,什么样的抽象才是对的;这些信息该存进什么样的存储系统;在这种规模下,跨多个数据中心读写数据时,底层该如何支撑。 这些其实都是非常经典的分布式系统问题,不是吗? ## 研究不是一条直线,它更像在雾里走图 主持人:对,我也是这个意思。听起来在现在这种计算规模下,确实有很多软件工程、后端基础设施类的问题。但我还是觉得,在那条光谱上的某个位置,应该会出现一个真正的跃迁——需要一些全新的能力。比如说,你把一个普通后端工程师直接丢去改模型架构,这显然和做基础设施又不是一个量级的跳跃。 你怎么看这个区别? Vlad:对,我觉得确实有这样一个分界点。**研究这件事,本质上是一种高风险、高回报的活动。我们常会说一个词,叫“研究品味”,也就是一种高层次的直觉:在一个项目里,你面对很多不同的里程碑和可能路径时,到底应该沿着哪条路往前走。** 从某种意义上说,软件工程项目也可以被看成类似的一张有向图:你有一堆中间产物要完成,最终才能到达目标。 但软件工程里的这张图,整体上更接近确定性的。你先搭一个服务,再搭另一个服务,再搭第三个服务;先把存储层搞定,再处理上层功能。你大体可以稳定地一路往前推进。 **研究就不是这样。研究里的这张图是带随机性的。**因为其中一些节点——比如某个研究想法,或者到达最终目标所必需的某个环节——并不保证能成功。 我觉得这要求一种思维方式上的转变。而这种转变需要时间去学,也需要一些专门培养出来的能力。这就是很多人在博士阶段逐渐建立起来的那种东西。 如果要我用一句比较简洁的话来概括,我会想到 Jacob Steinhardt 教授的一篇非常出色的文章。我很喜欢用他的框架来理解自己做的研究:研究是一种马尔可夫决策过程。 所谓马尔可夫决策过程,指的是:在一个研究项目里,不同里程碑之间存在一张带有随机性的依赖图。你可能必须先拿到某种结果,或者先证明某种结论,才能到达后面的目标。 类似地,在一个机器学习研究项目里,你可能得先把某种特征方案跑通,之后才有机会获得某种图像识别准确率,图上的节点和路径都会不断展开。 这是一种高度不确定的探索活动:某些方法可能有效,也可能无效;而一种方法一旦有效,又会为你打开一组新的可能性。 在软件工程里,你也许可以把所有通往目标的路径都列出来,然后问:最短路径是什么? 但研究里,这种方法并不最优。因为一旦图上的边不再可靠,有些节点甚至你还根本不知道——也许它们是隐藏的——那你处理问题的方式就必须改变。 **具体来说,你必须同时考虑不同研究方向的成功率和时间投入,还得事先对这些概率做出估计。** 而这和给一个软件项目写设计方案,是完全不同的一种思维活动。你得培养出一种直觉:在你还没真正做一件事之前,先判断它成功的可能性有多大。 很多人把这种能力和“研究品味”联系起来,我觉得这是对的。因为你如果想真正穿行于这种研究过程里,这种判断力就是必须建立起来的核心能力。 主持人:听起来你的意思是,研究里有更多的不确定性。我还是想更具体一点去理解这种工作的性质。如果你把一个后端工程师扔进一个做研究的团队里,具体会在哪些地方出现明显短板? Vlad:我第一个想到的,就是你是否具备足够的研究背景,足够理解自己所处的研究版图。 研究工作很大程度上要求你有一种很谦逊的心态:你得承认,在你之前,这个方向已经有了大量投入;而在你真正了解这个主题上全人类目前最前沿的积累之前,你大概率不可能继续把这个前沿往前推。 所以,**在某个具体方向上建立扎实的已有工作认识,并真正做好相关文献梳理,可能就是很多人最先会卡住的地方。**你得有能力沿着一个主题的引用脉络一路追下去,知道该读什么、怎么读。 因为你根本没时间把所有论文都读完,所以你必须培养一种判断力:哪些论文最值得读?在不阅读全文的情况下,怎么判断一篇论文到底值不值得投入时间? 这是我最先想到的一项必须建立起来的能力。 而且,光是要看懂这些研究级论文,你本身就得具备机器学习和计算机科学背景。再进一步,还要看论文属于哪个领域、讲什么内容;有些论文背后需要的数学基础和课程训练都很重,没有这些前置知识,你根本不可能真正理解它的方法。 这件事非常重要,因为如果你不了解现有的方法论是什么,你几乎不可能在它的基础上做出改进。 比如我前面提到,我们团队做蒸馏。如果你想推进大语言模型蒸馏方向上的理解,你首先得很好地理解我们到底想用大语言模型去做什么。 我简单概括一下:**大语言模型研究,尤其在预训练阶段,核心就是缩放规律。** 什么叫缩放规律?很多人会特别关注它是不是幂律、指数是多少,但真正重要的其实不是函数形式本身。真正重要的是:对于一套扩大语言模型的方法,当你不断往一次预训练里投入更多计算量时,你必须能够预测,这个语言模型最终的测试损失会落在什么位置。 为什么这个问题重要?为什么我们要预测模型的泛化误差? 在传统机器学习世界里,比如说我们做图像识别,打 ImageNet,你的测试损失就是那一千个类别上的分类错误率。你提出一个网络结构,比如 VGG 或 ResNet,训练一下,再看它的分类错误率是多少,这就能估计这个模型在这类任务上的表现。 我们还可以通过验证集来估计方法好不好。每当出现一个新的网络结构想法,我们训练一下,做一系列验证实验,得到交叉验证误差,而这个误差本身就是对最终测试误差的估计。于是你就可以通过这个流程不断迭代不同想法。 但大语言模型不是这样。因为每一次真正做预训练,你投入的计算量都会比之前任何一次都更大。 所以从某种意义上说,它像是一个“一次性”的 ImageNet 问题。你永远没有机会先完整地看一遍真正的 ImageNet,再慢慢调。你只能先在 MNIST 上练,再到 CIFAR 上练,然后试图根据这些经验,设计一种办法,希望它第一次上 ImageNet 就能直接奏效。 如果你真这么做——我相信很多人都试过,我自己当年学这些东西的时候也一样——你会发现,它在 MNIST 上很好,在 CIFAR 上可能也不错,但一到 ImageNet 就突然崩掉。 你会慢慢意识到,很多东西并不会随着规模自然泛化。 所以,我们在大语言模型里做的大量工作,其实是在设计“配方”。**所谓配方,就是一个函数:输入是你愿意投入多少计算量,输出是一整套语言模型训练流程。** 如果你能把这套配方和一种预测规则结合起来,而且这个预测规则能够准确预测最终效果,那你就可以据此做决策,去改进你的训练配方。 我刚刚这一大段,其实是在给大语言模型研究的基本面貌提供背景。但这种理解之所以存在,是建立在大量早期语言模型缩放研究之上的,比如 Kaplan 的论文,比如 Chinchilla。 自从那两篇论文之后,又有很多工作开始研究:除了参数量和训练词元数,究竟还有什么因素会影响预测准确性,比如不同词元的独特数量等等。 但我会说,这两篇论文对大语言模型来说都是基础性文献;而它们本身又建立在更长的一条缩放研究脉络之上,可以一直追溯到最早期的 GPT。Google 这边也通过 PaLM 系列论文积累了大量这方面的研究。 这些工作共同塑造了我前面描述的那种视角。而这种视角,基本上只有你自己亲自沿着那条文献线索走过一遍,才会真正建立起来。 主持人:假设你要给自己的团队选人,而你判断一个人是否适合帮助你推进前沿的标准,是他对前沿本身的理解,包括对已有文献的掌握,而这又要求很多前置能力。我记得你在文章里把其中一部分叫作“数学成熟度”。 Vlad:对。我觉得,一旦你具备了数学成熟度,理解这些论文、读懂这些论文,其实并不难。 我刚才提到的那些论文,现在基本都已经算是入门门槛了,所以如果是候选人,我默认他们应该熟悉这些内容。 但更一般地说,关键能力在于:**你能不能钻进这种级别的论文里,把它真正读懂;你能不能把论文里的研究想法自己实现出来。这是一项非常重要的能力。** 我们会看到各种各样的想法,它们未必都能直接应用到我们的领域。但如果你能深入理解它们,你就可以在这些想法上继续迭代,并把它们改造到我们的应用场景里。 所以当我们评估一个人是否能处理这些机器学习论文中的数学概念时,这大概就是最关键的能力信号。它说明你能拿起一篇陌生论文,判断其中哪些想法可以迁移到 Google 的实际环境里。 ## 真正值钱的能力,常常在系统最底层 主持人:这肯定不是一份穷尽清单,但我还是很好奇:还有哪些领域,是人们可以去深入钻研、而且对前沿人工智能研究确实重要的?你提到了蒸馏,也提到了内核。听起来内核几乎在哪都很有用,但除了这些之外,还有没有什么你会顺手列出来的方向? Vlad:我觉得一个非常有力量的方向,其实是编程语言研究。 **因为如果我们能在编程语言层面创造出更好的抽象,就能极大促进内核开发。**我觉得 ThunderKittens 就是一个很好的例子。它提供了一种抽象方式,让你写内核的时候,只需要围绕四个函数工作,而不是去面对一大团随意拼起来的 C 代码。这样一来,你在开发那些能够充分利用硬件的算法时,速度就会快得多。 这时候重点已经不只是编程语言研究本身,而是你是否对这种抽象充满兴趣,并愿意和那些关注底层硬件的人一起工作,比如去尝试 CuTe 这类领域专用语言。 这类方向里有很多都是围绕特定硬件设计的专用语言。 除了编程语言和缩放规律相关文献之外,我还会想到强化学习文献。 特别是自从“基于人类反馈的强化学习”出现之后,我们已经看到像 PPO 这样的深度强化学习算法,确实可以进入生产系统。曾经有一段时间,这件事到底成不成立,其实还是有争议的;但现在几乎已经形成共识:这些算法确实会被应用在真实的生产环境里。 而想理解它背后的理论,你通常得从强化学习的基础一路往上学,再走到今天非常丰富的各种价值型方法和策略梯度方法。 这是另一个我觉得文献脉络极其丰富、非常值得慢慢爬进去的方向。 再往“后端工程师”一点的方向说,除了内核本身之外,我觉得分布式系统和优化之间,还有一个非常有意思的交叉地带。比如:如何设计神经网络训练算法,让它能在大量图形处理器上训练——这里面会有很多有趣的问题:异步性、梯度的新鲜度、流水线方式会怎样加剧梯度陈旧,等等。 **你在训练算法设计里做出的这些系统性选择,都会影响神经网络的收敛情况和最终质量。** 这些问题其实就算脱离大语言模型场景,也可以单独研究,而且已经被研究很久了。所以如果你更偏基础设施方向,那我会说,先把这些算法是怎么运作的弄明白,会是一个非常好的起点。 主持人:你觉得不同前沿实验室之间,对人的要求会有差别吗?比如说,如果有人想去 Google DeepMind,是不是会有某个方向比 Anthropic 更受重视?至少从技能组合上看,我感觉应该还是挺接近的。 Vlad:对,我觉得不同实验室可能会在商业策略上有所差别,提供的产品和服务也会因为各自的专长和客户类型不同而不一样。 但如果问大家真正看重什么,我认为实验室之间重叠其实非常大。我那篇文章发出去以后,你会看到 OpenAI 和 Anthropic 的人也在说:对,这些建议我们也认同。 所以我觉得,这至少算一个小小的证据,说明大家在这件事上其实非常接近。 主持人:我觉得很多人之所以特别想往人工智能研究靠近,是因为他们在想:未来软件工程也许没那么重要了。那研究这边会不会也有类似问题——大语言模型以后会不会也把很多研究工作接过去?所以人工智能研究未必就比软件工程更值得押注。 Vlad:我觉得研究能力只会越来越重要。 **能够处理工作规划里那些不确定、随机的成分,会越来越成为我们工作的核心部分。**你要学会怎么在你做的任何事情里利用人工智能——而且这件事甚至不必局限于软件——这种能力应该立刻开始练,因为这些系统本来就不是确定性的。 你真正要思考的是:我怎样围绕这些大语言模型搭系统,让自己把工作做得更有效?未来真正能把你和别人区分开的,就是这种能力。我觉得不管你具体做什么,这一点都成立。 坦白说,现在到处都是恐惧营销。尤其有些人在谈人工智能的时候,本来就在故意制造这种恐慌。我的感觉是,人们真正应该做的,是把注意力放回自己身上,想办法让自己变得更高效。 **我并不认为人工智能会取代我们所有人的工作。**原因在于,人类在组织里承担的一个关键角色,是构成一张信任网络。组织本身就是一组资源和一群人,而这群人负责管理这些资源。 我们的一项重要职责,就是把这些资源分配到特定目标上。 就算人工智能能大幅加快执行速度,关于资源如何分配的决定,最终还是必须落到具体的人身上。这件事永远要有人负责。因为你不能把责任推给人工智能。 比如说,现在的大语言模型已经非常懂法律了,它可以帮你审合同之类的;但它不能代表你出庭,因为它不可能被吊销律师执照。 我觉得这就是一个非常尖锐的例子,说明为什么法律职业依然会存在:即便大语言模型很擅长调用先例、理解法理,**你还是需要一个能为结果负责的人,去验证人工智能的输出,用人工智能来更高效地完成法律工作,而不是把自己的法律辩护整个交给一个语言模型。** ## 别被恐惧营销带着走 主持人:对,我觉得当初促使你写那篇文章的原因,其实也正是这种恐惧气氛。 Vlad:对。我真的觉得,人们应该拥有的是一种更建设性的心态。 我之前看到一条推文,好像是 Deedy 发的,里面是那种很长的恐慌叙事,说什么人工智能会制造一个永久性的底层阶级之类的。人很容易被卷进去。 但我觉得真正该想的是:**我们每个人都对自己的未来拥有主动权。今天就可以开始投资那些对明天有意义的能力。这才是唯一真正该做的事。光担心,什么也改变不了。** 所以我想写那篇文章,也是为了回应这一点。因为我确实感觉到,这种情绪一直在扩散。前阵子我去普林斯顿做讲座,现场一个很大的问题就是:我怎样才能去 Google DeepMind 工作? 而且这几乎就是大家知道我在做什么之后,最常问我的问题。 所以我想,也许给出一些更具建设性的方向,会对整个讨论更有帮助。 主持人:关于那篇文章最后还有一个问题。因为如果你想拿到一个岗位,当然一方面是能力本身,我们前面聊了很多你的能力是否匹配这个岗位;但另一方面,其实还有“信号”——你如何向外界展示自己,以及什么样的信号是被看重的。 如果你要把自己推给这些前沿实验室,什么样的信号最重要? Vlad:**最重要的是,拿出真实证据,证明你沿着这些方向做出过对别人有用的东西。比如内核开发。** 现在已经有很多开源大语言模型了,你完全可以拿其中任何一个来做优化。你甚至不一定要把模型本身做得更强。很多场景下,只要你能证明:在某个设定里,我把这个地方做快了,把那个地方做顺了,这就已经很有价值了。 而且事情也不只是在图形处理器上加速模型推理。围绕大语言模型的服务栈,本身就是一个非常复杂的分布式系统。它要维护键值缓存,还要处理各种负载均衡、请求排队——这些都是后端服务里再常见不过的问题。 这些项目一直都需要帮助。所以像给 vLLM、SGLang 这种项目做贡献,或者基于 TensorRT 做一些实践展示,都会很有价值。TensorRT 那边我记得还有个分布式系统叫 Dynamo,它支持把推理服务拆分部署。你如果能展示自己基于这些组件做了项目,或者真正改进了这些组件—— 对我来说,这会是非常强的候选人信号;同时我也觉得,这会是对开源社区非常受欢迎的贡献。 主持人:还有一点,我们前面很多讨论都默认了一条路径:从外部跳进前沿实验室。 但其实这些实验室背后往往都有很大的组织体系,很多团队并不是直接做最前沿研究的。比如在 Google 体系里,有些基础设施工程师可能本来在搜索团队工作,有很强的后端能力,但领域背景没那么深,然后他们想内部转到 Google DeepMind。 在这种内部转岗的情况下,你的建议会和外部候选人不一样吗? Vlad:我以前在搜索那边有一位合作很紧密的同事,后来真的转到了我团队,叫 Nate Lintz。他非常厉害,现在在我们团队里负责了很多核心工作,特别是在 Flash 和 Flash-Lite 的推理协同设计方面。 我觉得他就是一个很好的例子。他当时的思路是:我怎样才能帮助自己所在的产品线,尽可能有效地采用这项技术? 所以我会说,如果你所在的组织不是直接造模型的,而是试图利用这些模型,那这里面其实有一个很大的空白:**如何真正把这些大语言模型高效地应用到你的组织里,如何高效地把它们服务起来。** 如果你能成为那个把这件事做得特别好的人,这不仅会给你的团队创造巨大的业务价值——这显然会让你在本组织里脱颖而出——同时,你也会自然而然成为我们研究团队在对接产品落地时最重要的合作方之一。因为我们会需要和你这样的人协作,确保模型能在你们组织里真正发挥作用。 所以到了那一步,你也许会想转岗,也许不会。你如果想转,我们当然很欢迎。 但即便你不转,**其实你已经在做一件非常前沿的事情了:把这种新技术整合进真实产品,让真实用户去使用。** 所以,对这种情况,我的建议大体就是这样。 ## 先做出东西来,信号自然会出现 主持人:在那篇文章快结束的时候,作为收尾,你还发出了一个很具体的邀请,因为我知道你当时在招人。要不要把那段再讲一下? Vlad:对,我当时是在想:我怎么才能真正做到“说到做到”?怎么证明我不是只在嘴上说这些能力重要,而是真的愿意按这个标准去看人? 我想表达的是:**如果你能通过一些具体练习,证明自己至少在我强调的那些能力上已经有了一些初步证据——比如意图、数学成熟度、韧性——那我愿意认真看。** 所以我列了几项练习:有些是为了展示你对缩放规律已经有初步理解;有些是要你在工程层面愿意深入细节,真正亲手实现一个 Transformer;还有一些则是展示你愿意掌握我们每天都会用到的那些基本数学,用来估算和设计这些大语言模型。 我现在已经记不清完整的练习清单了,但如果你把《缩放之书》里的题目认真手写做完,录一段自己讲解过程的视频,再加上我文章里提到的 Transformer 练习,把这些都发给我—— 那就是非常有力的东西。如果你能在纽约办公室工作,我会非常愿意面试你。 确实已经有不少人因此联系我了。我其实已经收到过几份提交,现在也已经在推进其中一些人的面试流程。 所以,这件事工作量当然不小。但让我很惊讶的是,我大概在文章发出后一周内,就收到了回应。说明这件事确实是做得到的。 当然,我的招聘名额不是无限的,所以这个邀请虽然有效,但我也不可能招无限多人。 不过好的一点是:**这本身就是一种非常强的自我成长信号。所以,不管你最后会不会因此去 Google DeepMind,这些事情都值得你为了自己去做。** 而且我觉得,它也会帮助你准备去其他地方面试。 当然,如果你真的完成了这些练习之后联系我,即便我这边已经招满了,我也认识很多其他正在招人的人,我也很乐意帮忙推荐。 ## 真正有意思的,是把模型做对,也把硬件吃满 主持人:接下来换个话题。我看到你是 Gemini 预训练方向的负责人,我觉得挺有意思的,很想听你从自己的角度高层次讲讲:在你看来,预训练到底是什么?以及这个方向上最重要的挑战有哪些? Vlad:可以。 作为预训练方向的负责人,我们要做的事情其实很多。 我团队负责交付的具体产品,包括 Flash 模型和 Flash-Lite 模型。这些模型会被用在搜索里的 AI 概览 and AI 模式上,也包括一些供其他组织内部使用的一方模型,比如广告 and YouTube。 除此之外,我们还是 Google and Apple 合作中的关键技术负责人之一,所以也会做那边的技术工作。 这些是我团队承担的产品层面交付。 再往上,我们还要做研究,确保这些交付本身处在业界最先进水平。同时,我们也做一些更通用的预训练研究,再反过来贡献给 Pro 系列模型。 如果从研究性质来分,我会说大体可以分成三个方向。 **第一是前面提到过的蒸馏。** **第二是我喜欢称之为“推理协同设计”的东西。**也就是:设计那些在推理时足够高效的神经网络架构。具体来说,就是决定网络的拓扑结构,决定 Transformer 里门控层和线性层的矩阵形状,决定注意力机制的形状、注意力头数量,诸如此类。目标是让这些设计在你实际部署的硬件上,能尽可能高效地运行。 **第三个支柱,是新的量化方法。**量化一直是我特别有感情、也从加入 Google 以来一直在研究的方向。它实际上会改变前两个方向能够做到什么,因此推进模型压缩的最前沿,也就成了我们团队研究中的重要组成部分。 一般来说,量化指的是:在某种意义上减少神经网络权重表示所占据的体积。 通常在训练时,神经网络里的那些矩阵参数是用三十二位浮点数来存储的。 但事实证明,**在实际计算中,你根本不需要那么高的精度,模型质量依然可以保持得很好。**用一些并不算复杂的方法,就能把这些权重的存储精度压缩到四位。 也就是说,本来三十二位浮点数能表示一大段数值范围、达到大约七位精度的东西,现在居然能以相当高的保真度,用四位整数来表示——而四位整数覆盖的范围其实非常小,大约只是从负八到七。这本身已经像奇迹一样了。 但更神奇的是,你甚至还可以把类似的量化变换应用到神经网络运行时的激活值上。 一旦做到这一点,实际做矩阵乘法时,参与运算的数就会比以前小得多,因此运行神经网络所需的电力也会显著下降。 有意思的是,人工智能硬件总运营成本里,有百分之九十九都来自驱动这些芯片所消耗的电力。如果你能把这些运算做得更便宜,神经网络就能更廉价、更高效地运行。 这会直接帮助你处理更多请求,也会改善时延。 所以量化研究的核心问题就是:我们怎样把前沿继续往四位之外推进? 主持人:我在推特上经常看到一种说法,老在讨论“模型浮点运算利用率”。对于不在这个行业里的人,或者说不了解这个概念的人来说,他们一看到那个数字只有十几个百分点,就会觉得:哇,这不是浪费了绝大多数图形处理器资源吗? 我想请你帮大家解释一下,为什么看起来“低”的模型浮点运算利用率,其实一点也不低。顺便也请你解释一下它到底是什么。 Vlad:对。所谓模型浮点运算利用率,本质上是这样算的:把神经网络实际完成的浮点运算次数,除以在这段请求时间里,硬件加速器理论上本可以完成的总浮点运算次数。 所以从某种意义上讲,这个指标告诉我们:在多大比例的时间里,我们真正有效利用了这块加速器的浮点运算能力。 如果你想达到百分之百的利用率,那意味着你必须把硬件里的矩阵乘法单元一直吃满。 也就是说,它只能不停地在循环里做矩阵乘法,不能去读内存,也不能做任何别的操作。 但这种计算在现实里没什么意义。神经网络需要做激活函数,需要做注意力计算,需要把中间结果写回高带宽显存。所有这些操作,都需要使用内存总线,或者向量处理单元。甚至有些数学操作,本来就是底层硬件里比矩阵乘法慢得多的部分。 这些因素都会导致模型不可能一直按处理器标称峰值运行。 **所以你之所以看不到百分之百的利用率,是因为神经网络有一部分时间在读写内存,另一部分时间在做一些天生就比矩阵乘法慢的操作。** 我前面提到的推理协同设计,其实很大一部分就是在协调芯片的各种能力:和其他芯片之间的通信、内存带宽、从内存中读取参数的速度、浮点运算能力——这里既包括矩阵乘法,也包括向量运算,比如做激活函数。 这些能力在硬件上都有不同的速率,而任意一种计算都不可能天然精确匹配硬件每一类能力的最佳节奏。 **在设计神经网络时,你要做的是选出一组结构形状,让这个网络能尽可能同时吃满这些硬件单元,从而在推理时把利用率尽量拉高。** 而让这件事不只是一个代数题的原因在于:这些设计选择最终会影响你训练出来的神经网络质量。 所以**推理协同设计真正有意思的地方就在于:我们怎样设计出一种神经网络架构,它既能稳定地随规模扩大,又有好的质量预测,同时还能让推理时的硬件利用率尽可能高。** 这种联合优化,正是推理协同设计最有趣的地方。 而且它还是个常青问题。因为随着硬件变化,浮点运算、内存带宽、通信带宽之间的相对关系也会变化,而这又会改变“什么样的神经网络形状才是最优”的答案。 ## 很多关键工作,并不光鲜 主持人:换个话题。Google 有一种叫“即时奖金”的机制,就是有人可以因为你做得特别好,给你一笔一次性的奖金。我在你的履历里看到,Jeff Dean 这位传奇人物曾经给过你即时奖金。 如果你愿意讲讲那个故事的话,我很想听。为什么他会给你这个奖金? Vlad:那其实发生在 Gemini 项目刚开始的时候。 Jeff 当时给了一批参与 Bard 第一版发布的人即时奖金。我在那个非常庞大的项目里,其实只做了一个很小的贡献。我帮忙做了监督微调,参与了 Bard 最早几个发布版本中的某一版。 那段经历给我最大的启发是:在那个时候,我还只是 Google Brain 里一个纯做研究的人,我当时非常执着于一件事——怎么尽量多发第一作者论文到 NeurIPS、ICML、ICLR。 我非常清楚地记得,当时我脑子里的第一反应其实是:我是不是应该继续低头写论文? 很幸运的是,那时我的经理 Rohan Anil 非常鼓励我们都投入这个方向。对我来说,这正好给了我需要的推动力——让我真的卷起袖子,去做很多超参数调优 and 工程工作,想办法让这个模型在一些非常老的张量处理器上跑起来,好为监督微调多争取一些训练机会。 那次很小的初步参与,后来得到了 Jeff Dean 的认可。我觉得它也进一步推动了我在大语言模型方向上的投入,最终把我带到了今天的位置。 所以我会说,这件事的重点并不在于,我当时那一点监督微调工作对最初发布到底帮了多大忙。 **更重要的是,它让微观的我认识到:想参与那些高价值项目,你往往需要投入很多并不光鲜的工作。可能只是超参数调优,只是为了让程序塞进特定内存预算里,不停去挤压编译器表现、抠那点空间。** 但这些工作,都会服务于更大的业务目标。而这件事,对于进入真正重要的项目来说,非常关键。 主持人:你在 Gemini 上也做了很久了,而且这还是一个最高优先级项目,所以你一定经历过一些事故或者“战争故事”。我很好奇,你最喜欢的一段 Gemini 故事是什么? Vlad:如果让我选,我最喜欢的应该是 Flash 2.0。 那真的是一段非常艰难、也非常漫长的旅程。但我们当时最核心的优化目标之一,是延续 Flash 1.5 已经建立起来的那个定位:做一种非常快、时延很低、但质量依然很强的模型。 尤其是它必须快,因为搜索需要它在 AI 模式里非常迅速地返回回答。 正因为如此,在 Flash 1 的时候,虽然我们已经知道混合专家模型,也知道它可以显著提升容量,但当时一个很现实的问题是:我们当然想用这种新架构,可你很难直接切过去。 因为混合专家模型的特点之一就是参数通常更多。而参数一多,就会占用更多高带宽显存。可我们部署所用的这些芯片,高带宽显存是有限的。 所以你就必须把这个混合专家模型切分到多块芯片上。假设你有 N 个专家模块,那你可能得把它们分布到 N 块芯片上,或者按某个和 N 相关的比例分布。 这样一来,模型中间就会出现大量通信。当一个词元需要被路由到某个专家模块,而这个词元原本在第一块张量处理器上,却必须送到最后一块去处理——你就在前向传播过程中引入了巨大的通信量。 而这个操作的时延会随着 N 的增加而急剧变大。**混合专家模型的难点就在于,它会把 N 推得很高。这就成了一个非常严重的瓶颈。** 有意思的是,我们其实很早就知道流水线式服务这个思路。只是对稠密模型来说,它一直没有真正重要到必须采用。 我很清楚地记得,自己很早曾和 Sholto 聊过这个事。Sholto 当时说:对啊,你这里主要受限于浮点运算量,所以做流水线并不会改变输入预填阶段的性能曲线。 后来证明他是对的。我试了一下,然后就把这个想法搁置了。 但有意思的是,当时我团队很小,我手下的一位同事 Geng Yan 提出了一个非常好的想法。他当时和 Rahul Arya 以及 Google 以色列团队的几位同事合作,**提出把流水线式预填应用到混合专家模型上。** **所谓流水线,就是说你不再把那 N 台机器并行地分给同一层里的 N 个专家模块,而是把不同的层分配到不同机器上。** 也就是说,不再是在某一层里把词元在各台机器之间来回路由;而是某一层的机器先处理你预填请求中的一部分词元,再把这些处理过的词元传给下一台机器,让它处理第二层,再传给第三层、第四层。 这样一来,所有专家模块都可以常驻在单台机器上,或者更少数几台机器上。它本质上改变了通信模式:从原来那种每一层都要做大量词元交换,变成了一种可以被其他计算掩盖掉的通信方式。 因为你可以把流水线式预填分摊到请求的不同部分。比如第二层在处理请求前一千个词元时,第一层所在的第一台芯片已经可以开始处理第二个一千词元了。 所以,这其实是一种打破高带宽显存约束的方法:不是把专家模块在机器之间搬来搬去,而是把网络层分布到不同机器上。 正因为如此,**通信开销降下来了,混合专家模型的时延突然就变得非常有吸引力。** Gemini 2.0 的技术报告里写得很清楚:它是一整个混合专家系列模型。而使这件事成为可能的原因之一,就是这种推理阶段的服务创新。 Dwarkesh and Reiner 有一篇非常棒的文章,专门讲这个优化,而且你甚至可以把它写进《缩放之书》的代数框架里去理解。 这也是一个很好的例子,说明这种看似局部的改动,实际上会对大语言模型质量产生多么巨大的影响。 真正让 Flash 2.0 那段经历如此有成就感的,是这个重大的混合专家决策。它在当时听起来像个小技术选择,但大家真的非常担心:这个模型的时延到底能不能压到合理范围。 好在我最后推动了一套非常透明的技术决策流程,把问题彻底查明了。最后我们做出了正确的判断。 可接下来还得训练它。 这是一个在 Flash 这个规模上,我们训练过的最大模型。我们知道这是对的方向,但接下来的四十天会是极其艰苦的过程,而且团队非常小。 负责这次训练轮班的人,可能只有五个左右。我记得我们几乎是一天接一天地交接,轮流做这种运维式工作:想办法让训练任务一直活着。因为在当时,这真的是一个非常需要人工盯着的过程——你得确保所有东西都稳定推进,确保数据迭代器调好了,不会拖慢任务;如果数据里有空洞、索引有问题,你必须立刻修补,因为每一分钟都在烧掉巨量算力。 主持人:那夜里和周末怎么办? Vlad:对,所以那四十天里,我们基本没怎么睡。 我们必须在巴黎办公室 and 山景城之间做双班倒。 而让这一切最终变得特别值得的,是模型发布的时候,差不多正好赶上 DeepSeek-V3 出来。那时《华尔街日报》发了一篇很夸张的“红色恐慌”式文章,讲什么中国要靠开源模型接管人工智能之类的。 我记得我朋友给我发来一张截图,是大模型竞技场排行榜的一张表。最右上角是 ChatGPT,DeepSeek 紧随其后。然后文章还在说,DeepSeek 只花了几百万美元训练,就已经追得那么紧。 我朋友就跟我说:哦,Gemini 落后太多了。因为那张表最底下放的是一个我记得像 Flash 1.5 Pro 之类的版本。 然后我一看,心想:这挺有意思的。我刚好一直在看这个排行榜,因为我们刚发了一个模型,而网站上的实际情况显然不是那样。 后来才发现,《华尔街日报》那篇文章里把一些行给省略掉了。所以如果你今天再回去看那篇文章,你就会看到,当时真正处在业界最前沿的模型——Flash 2.0 Thinking——其实在表格的右上角,远远领先于 DeepSeek-V3。这多少会让他们当时想讲的那个“开源压倒一切”的叙事不那么成立。 但对我们团队来说,那确实是一次非常重要的成就。 ## 做那个别人真心希望他成功的人 主持人:最后一个问题。如果你可以回到自己刚大学毕业的时候,大概就是本科毕业那会儿,然后给那个时候的自己一些建议——以现在的你所知道的这些东西——你会说什么? Vlad:**你得去追那些这个世界今天真正面对的问题。去追那些人们在日常生活中真正遇到的挑战。不要害怕自己切进去的只是这个问题里较小的一部分,或者听起来没那么体面的那一部分。** 即便它不是那种“很高级”的研究、数学之类的东西,也没关系。你要相信,只要你是在做重要的事,哪怕只是一个更大项目里的较小组成部分,你最终也会看到,真正推动前沿往前走的,到底是什么。 我想,这里面需要一种面对问题时的谦逊。你真正该追求的是这个。 如果再说另一条建议,也许更偏职业层面一点,那就是:**成为那种别人愿意看到他成功的同事。** 我的意思是,大家总会谈什么“职场精神病”、马基雅维利式领导者,或者那种为了结果不惜一切代价的人。他们也许能通过压榨别人,换来一些短期收益。 但这么多年和各种样的人共事下来,我觉得最有意思的是:我见过极少数那样的人——其中有一位特别亲近,是我的朋友 and 导师 Todd Lipkin,也是最早带我进入计算机科学的人——他们非常善良,而且你能从他们身上学到很多。你会真心觉得:我愿意跟着这个人一起做事,也愿意帮助他成功。 特别是,**如果你是那种能帮助别人把项目做成的人,能提出一些项目,让别人可以用自己的互补能力在其中发光的人,大家会注意到这一点。**将来他们也会更愿意参与到你提出的项目里,也会更愿意支持你。 很多人一想到职场互动,就会变得很犬儒,总想着博弈,想着怎么占优。 但我的经验是,这种更友好、更合作的方式,往往会培养出一种很深的协作感 and 互相帮助的意愿。而要把那些需要多人、多种能力共同跨线的大项目真正做成,这种东西太重要了。 所以,如果我能给更早版本的自己一点人际层面、职业层面的建议,那就是:**去做那种人。做那个别人会真心希望你成功的人。** 主持人:我很喜欢这番建议,因为它正好对抗了那种很犬儒的建议。我也很喜欢,你最初那篇文章本身,就是在对抗那种“末日论”“永久底层阶级”式的说法。非常感谢你今天抽时间来聊。真的很有意思,也非常感谢你。 Vlad:谢谢你邀请我,Ryan。 本文来源:[CSDN](https://mp.weixin.qq.com/s/e7JScxqN_KvsFjJfPdlFJw) 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 25 mins ago
#华尔街见闻 据新华社,中国人民银行法修订草案6月23日提请全国人大常委会会议初次审议。修订草案加快完善中央银行制度,进一步健全宏观审慎制度框架,统筹发展和安全,牢牢守住不发生系统性金融风险的底线。 中国人民银行法是我国确立和规范中央银行制度的基本法律,在保障货币政策制定和执行、建立和完善中央银行宏观调控体系等方面发挥了重要作用。随着近年来我国金融业发展变化,现行中国人民银行法的法定职责等规定已不适应现实发展需要,宏观审慎管理等制度有待健全,亟需修改完善。 **中国人民银行行长潘功胜受国务院委托在会议上作关于修订草案的说明时介绍,修订草案共8章54条,贯彻落实中央金融工作会议精神,加快完善中央银行制度,进一步明确中国人民银行职能定位,提升其履职效能。** 草案充实了中央银行工作总体要求,明确中国人民银行坚持党中央对金融工作的集中统一领导,贯彻落实党和国家路线方针政策、决策部署,统筹发展和安全。草案完善了中央银行基础管理制度,根据实践补充完善中国人民银行职责,明确了数字人民币的法律地位等。 货币政策和宏观审慎政策是金融调控的双支柱。**草案确立了中国人民银行货币政策和宏观审慎政策的法定地位,明确中国人民银行牵头建立宏观审慎政策框架,会同国务院有关部门制定宏观审慎政策,填补了宏观审慎制度的法律空白,进一步健全了宏观审慎制度框架。** 在维护金融稳定方面,草案明确中国人民银行对货币市场、票据市场、有关金融基础设施等的监管职责,规定其可以根据情形采取逆周期、跨周期调节等措施,维护金融市场稳定。 为提升中央银行监管有效性,草案还完善了中国人民银行检查监督金融机构等有关主体执行货币政策等行为的规定,对相关违法行为设置更为严格的法律责任,提高违法成本。(完) 本文来源:[新华社]( 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 26 mins ago
#华尔街见闻 6月23日,在FORCE原动力大会上,**火山引擎推出豆包大模型2.1**,同时预告了**视频生成模型Seedance 2.5、图像创作模型Seedream 5.0 Pro**以及**豆包音频生成模型1.0**的发布。 豆包大模型2.1在通用Agent、编程能力以及多模态水平上有所提升,包括豆包大模型2.1 Pro和豆包大模型2.1 Turbo,其中**豆包大模型2.1 Pro在编程能力上接近Opus 4.7**。 价格方面,豆包大模型2.1 Pro统一定价为输入6元、输出30元,缓存命中1.2元,**综合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%**。同时,面向高频调用场景的豆包2.1 Turbo同步上线,价格仅为2.1 Pro的一半。 ![图片](https://wpimg-wscn.awtmt.com/7e5ac267-42d0-4c69-a2df-aeb17e88b0b8.jpeg) 此外,火山引擎还推出了**Doubao-Seed-Evolving**,面向Coding与Agent的重度用户,将会以**每月2至4次的频率快速进行迭代**,让开发者可以明显感受到模型的变化。 大会还预告了即将发布的Seedance 2.5、Seedream 5.0 Pro以及豆包音频生成模型1.0,其中,**Seedance 2.5将单条视频生成拉长至30秒**,Seedream 5.0 Pro新增了圈选编辑和多图层分离能力,豆包音频生成模型1.0则实现了角色音色自动推理和影视级音效一次性生成。**Seedance 2.0也做了升级,支持原生4k视频直出**。 ![图片](https://wpimg-wscn.awtmt.com/b1c54fb9-da54-4e08-9225-56d99eac32a2.jpeg) 大会上,火山引擎总裁谭待公布了一组数据:截至今年6月,**豆包大模型日均Tokens调用量达180万亿**,相比两年前发布时增长超过1500倍,过去一年增速超过10倍。 ![图片](https://wpimg-wscn.awtmt.com/885ddc05-4263-417e-bbd2-63139899bba1.jpeg) 在公有云市场,火山引擎份额升至49.5%,同时,年消费超1万亿Tokens的企业客户从去年12月的100家**翻倍到了200家**。 ![图片](https://wpimg-wscn.awtmt.com/c47b33c4-7d9d-4c1f-86a5-538217a8688c.jpeg) 除了模型发布,火山引擎还展示了在智能体开发、产业落地、AI安全、商用拓展等方面的综合进展。 ## **Coding能力追平Opus 4.7 成本低80%** 豆包大模型2.1 Pro是本场发布会的第一颗重磅炸弹。 编程评测中,**豆包大模型2.1 Pro与Claude Opus 4.7基本持平**,在SciCode科学计算评测中拿到59.8分,超过Opus 4.7和GPT-5.5,在NL2Repo仓库级代码生成评测中,豆包大模型2.1 Pro得分47,**明显领先GPT-5.5和Gemini 3.1**。 ![图片](https://wpimg-wscn.awtmt.com/e75664cf-db9d-4680-a12d-3cf92b48c80f.jpeg) 现场演示了一个芯片设计场景的硬核案例:豆包大模型2.1 Pro围绕一个16×16 PE的Tile TPU,连续运行18小时、经历9轮迭代,完成了6个核心模块、1300多行RTL代码,并跑通了仿真测试和检测流程,最终通过了手写数字识别验证。这类任务通常需要3到5名资深工程师数周的努力。 ![图片](https://wpimg-wscn.awtmt.com/119e27c2-5451-4be5-b893-e8aeb6617615.jpeg) Agent能力方面,豆包大模型2.1 Pro在MCP Atlas评测(覆盖36个真实MCP Server、220个工具、1000多个任务)**得分超过Opus 4.7和GPT-5.5。** ![图片](https://wpimg-wscn.awtmt.com/f3248204-47b7-49c9-b26e-818f9985841c.jpeg) 在检验Agent与多模态能力的OS World和Mobile World等评测中,豆包大模型2.1 Pro也位居全球前列。 ![图片](https://wpimg-wscn.awtmt.com/88688694-ca56-4197-ba70-7c70bfbc08dc.jpeg) 在Agent能力演示环节,火山引擎展示了一段多Agent协同构建3D虚拟城市的案例。 开发者结合豆包大模型2.1 Pro的多模态能力,**让500多个Agent协同作业,在跨工具的完整链路中依次调用建模、渲染、贴图等11种工具,累计触发工具调用上千次**,最终在一张大地图上完成了100多栋造型、材质、颜色均不相同的建筑的搭建,并通过多轮自我迭代生成全景成片。 ![图片](https://wpimg-wscn.awtmt.com/b6301349-a6e9-431f-b45b-1cd01dd52edd.jpeg) 目前,豆包大模型2.1已在火山引擎开放API服务,火山方舟体验中心同步上线,豆包、TRAE、扣子等产品同步接入。 ## **视频、音频、图像模型齐发 Seedance 2.5预计7月上线** 视频生成是火山引擎声量最大的赛道,今年2月发布的Seedance 2.0被该团队称为“**全球第一个跨过生产质变点的视频生成模型**”,这次预告的Seedance 2.5在多个维度上做了升级:**单条视频最长30秒**,目前市场同类产品最多15到20秒,全球第一。多参考输入支持最多50个全模态素材联合输入,同样是全球最高。 ![图片](https://wpimg-wscn.awtmt.com/22970c10-6948-4571-82ae-0d704061a382.jpeg) Seedance 2.5的**3D白模预演能力**是本次视频模型升级中的一个关键功能,据字节跳动CEO梁汝波透露,这个功能灵感出自于一位业内知名导演,他在与火山引擎的合作中提出:科幻片和大场景调度中,3D白模是前期预演的核心工具,能帮团队提前确定空间、机位、走位和镜头运动,但传统制作耗时耗力。 ![图片](https://wpimg-wscn.awtmt.com/c82d75da-541c-4577-b162-42a54a8e85a9.jpeg) Seedance据此开发了白模预演生成能力,成为行业内率先提供这一功能的视频生成模型。这意味着**创作者在前期投入的资产设计和镜头调度,可以被模型直接承接,不用推倒重来**。 画质方面,Seedance 2.5生成的AI素材可以直接进入专业影视后期,**新增的编辑能力支持局部修改**,如微调背景、更换商品和模特等。 图像方面,Seedream 5.0 Pro主推三个能力: **1、交互式精准编辑。**用户可以画箭头、圈选区、用自然语言描述空间关系,模型理解意图定位到指定元素修改。 **2、多图层分离。**可递归拆分图层,拆分后底板自动智能填充。 **3、高信息密度排版。**单张图可承载整页PPT级别信息,支持英文、西班牙语、阿拉伯语、日语等10余种文字,自动适配各语言排版习惯和文化风格。 ![图片](https://wpimg-wscn.awtmt.com/5a86655f-2905-4df9-8553-506768e523ef) 音频方面,豆包音频生成模型1.0首次亮相。**模型可以根据文本自动推理角色声音特征,一次生成包含情绪表达、方言口音、背景音乐、环境氛围音、拟音特效的完整影视级音轨**。 发布会演示了一段古风武侠片,从人物对白到环境雨声、兵器撞击声全部由模型生成,时长近一分钟,音色不漂移、角色声音特征一致。 ![图片](https://wpimg-wscn.awtmt.com/61442a75-907d-44e2-8dfb-24d0d9771b9e.jpeg) ## **周星驰正版授权,AI走进全行业** 火山引擎在大会上正式预览了AI版权商业化平台,周星驰成为首批合作对象。他以《喜剧之王》《食神》《长江七号》三部经典IP授权入驻,用户可在抖音、即梦、剪映等平台用官方模板进行二创。 ![图片](https://wpimg-wscn.awtmt.com/91283cad-dde5-4ed6-aa24-d2d0831c6a3b.jpeg) 除视频创意之外,豆包大模型在各行业的渗透速度同样迅速见。 特斯拉基于豆包大模型打造智能语音车控,覆盖全系车型,接入了端到端实时语音模型。奔驰新款纯电CLA接入豆包大模型,支持自然对话和情绪感知。东风汽车今年4月与火山引擎达成战略合作,围绕智能座舱**企业数智化升级等**领域展开深度合作。 ![图片](https://wpimg-wscn.awtmt.com/936ec4c5-5e82-40a3-a5f1-b3ec51381555.jpeg) 金融和芯片行业中,中金财富基于HiAgent搭建数字投顾Agent,萃取300余名分析师研究成果和数千名投顾经验,定制金融智能体矩阵。安谋科技与火山引擎围绕EDA混合云展开合作,通过云端弹性算力补充本地资源,利用火山引擎Agent产品推动研发流程自动化。 运输、教育等行业中,顺丰依托AgentKit构建覆盖研发到调度的全场景AI办公助理。**新东方用豆包打造AI助教,覆盖口语练习、作文批改、个性化学习**。 支柱产业中,中国石油勘探院用上了安全运营Agent,异常告警实现AI自动化值守,运营效率提升10倍。中国移动与火山引擎联合推出移动引擎机密模型服务,面向政务、金融、能源行业提供国产算力一体化的机密模型服务。 ## **HiAgent 3.0全新升级,一键招募数字员工** 企业级产品线上,HiAgent 3.0是本次最重要的发布。IDC报告显示,HiAgent在中国智能体开发平台产品力进入领导者象限且位列第一,市场份额17.8%,同样行业第一,超过第二名和第三名总和。 数字员工管理方面引入了一套完整机制: **企业可以在员工市场一键雇佣活动策划等数字员**工,把已有的各类智能体快速接入统一管理。数字员工上岗前必须通过考核,系统提供通用考核模板,评估回答准确率、幻觉率、延迟、安全合规等指标,企业也可上传自己的评测集。 通过考核后,调度中枢会基于业务目标自动拆解任务、分发给不同数字员工协同执行。管理者则可以通过数字员工大盘统一查看状态。同时,分布式Harness记录不同Agent的运行轨迹、业务反馈和成功做法,总结到全局经验中,越用越聪明。 ![图片](https://wpimg-wscn.awtmt.com/568347de-62ef-41d1-91f3-3097dfe2c107.jpeg) **企业级AIAgent平台AgentKit新增policy和register两个模块:policy控制Agent行为边界,确保在身份、权限和策略范围内执行;register负责Agent的资产注册和发现治理。** ![图片](https://wpimg-wscn.awtmt.com/bd60ba75-7f33-4e66-95af-40d48155b97f.jpeg) ## **结语:字节把AI全家桶摆上桌面 全行业落地目标清晰可见** 豆包大模型2.1 Pro编程能力对标Opus 4.7,价格打2折,Seedance 2.5视频生成30秒直出全球第一,音频模型、图像模型齐齐亮相,**字节跳动在FORCE原动力大会上展示了其全模态发展的路径,从质量到价格全方位升级**。 此外,在企业管理、产业落地、商业化拓展等方面,都充斥着字节系AI产品的身影,其**全模态发展,全行业落地的目标已然清晰可见**。 本文来源:[智东西]( 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 26 mins ago
#华尔街见闻 ![](https://wpimg-wscn.awtmt.com/755afaea-b12e-4f9b-baad-1b64c22ab020.png)作者 | 黄昱 当Flyme被卖掉,魅族离画上句号似乎又近了一步。 6月22日晚间,亿咖通科技宣布,已签署最终收购协议,将收购星纪魅族旗下Flyme软件业务,包括Flyme Auto智能座舱操作系统和跨终端Flyme操作系统两大核心产品,交易总金额18亿元。 一个问题迅速浮现:如果连Flyme都不再属于魅族,那么魅族还剩下什么? 对于魅友而言,Flyme可以说是灵魂。过去十多年里,魅族最核心的产品竞争力,从来不只是硬件,而是那套以简洁、流畅著称的系统体验。 但如今,这项最重要的资产正式进入亿咖通体系。 不过,这笔交易并不只是一次资产出售。它背后既是吉利体系内部资源整合的结果,也是魅族多年战略摇摆、手机业务停摆后的必然收场。 亿咖通科技和星纪魅族同属吉利体系。 2026年4月,亿咖通科技就宣布将承接星纪魅族旗下Flyme OS知识产权、Flyme Auto业务及研发团队;直到此次18亿元正式收购协议落地,完成最终整合。 背后逻辑并不复杂。 2024年,吉利提出“一个吉利”战略,希望减少内部重复投入,把分散资源集中到优势业务上。智能座舱成为重点投入方向,而Flyme恰恰是体系内少数已经完成商业验证的软件能力。 公开资料显示,目前Flyme OS已形成覆盖手机、汽车、穿戴设备的跨终端能力,Flyme Auto累计上车已超过200万辆,2026年目标达到300万辆。Flyme已形成软件授权、定制开发、座舱方案交付等商业模式。 值得一提的是,亿咖通科技联合创始人、董事长兼CEO沈子瑜此前是星纪魅族集团成立后的首位CEO,2026年1月湖北星纪魅族科技有限公司(即星纪魅族)发生高级管理人员备案变更,卸任魅族董事长和CEO已久的沈子瑜成为星纪魅族董事长至今。 亿咖通表示,将设立独立软件事业部运营Flyme业务,支持Flyme平台及全系操作系统的迭代升级,并重点推进AI Agent版本研发。 沈子瑜本人也在朋友圈发文称:今年Flyme Auto 3.0一定会面世,在AI大浪潮下,Flyme Agent技术框架将会落地。同时手机侧的Flyme AiOS将会持续得到亿咖通上市公司的投入保证,也会进一步更新系统和维护系统。 这意味着,Flyme不会消失,只是脱离了魅族。 从“小而美”到持续失速,再到如今失去“灵魂”,魅族为何走到了今天。 如果把时间拉长来看,魅族的衰落并不是突然发生的。 它曾是中国智能手机行业最特殊的存在。 在黄章时代,魅族依靠工业设计和Flyme积累了极强用户口碑,一度与小米并称互联网手机双雄。那个阶段,魅族最大的优势不是规模,而是产品能力。 但问题也恰恰出在这里。当行业进入供应链战争、渠道战争和规模战争阶段,魅族仍长期停留在产品主义思维。 进入吉利时代后,魅族试图再次翻盘。 2022年,吉利旗下星纪时代收购魅族79.09%股权,并成立星纪魅族集团。当时市场一度认为,背靠李书福,魅族将获得第二次生命。 新战略也足够激进——手机、汽车、XR融合,三年重返手机中高端前五。 但现实比预期残酷。 过去几年,魅族高层频繁更迭:沈子瑜、苏静、黄质潘轮番接棒,组织不断调整,战略方向也始终没能稳定,中高端路线、性价比路线、AI路线几次切换。 真正的转折点发生在2026年2月。 魅族正式宣布暂停国内新手机自研项目,从硬件驱动转向AI驱动的软件公司,提出打造以Flyme开放生态为底座的新模式。 虽然外界对魅族的重振旗鼓并不太看好,但魅族当时还是有在努力与第三方品牌接触,也吸引了一些合作方。 在魅族宣布暂停手机自研的第二天,国产平板品牌酷比魔方主动在官微互动,提出"掌玩 mini 4 Ultra,Powered by Flyme"的设想。 3月24日,魅族科技发布消息称,自公司“战略转型公告”发出后,已有多家来自消费电子、智能座舱、IoT等领域的软硬件厂商,就Flyme生态合作事宜与公司展开洽谈,目前各项合作推进顺利。 但显然这些合作意向没能助力魅族重新走上正轨。 那么问题来了:魅族是否彻底结束了? 如果把魅族定义为一家独立手机厂商,答案可能已经越来越明确。 当手机研发暂停、Flyme 被整体剥离后,魅族事实上已经失去了过去最核心的两项能力——硬件产品定义权和操作系统主导权。 那个曾经依靠手机与系统一体化体验建立品牌认知的魅族,已经接近历史终章。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
资讯同步's avatar
资讯同步 26 mins ago
#早报中国 ![](https://cassette.sphdigital.com.sg/image/zaobao/736c2ec27879c38a7c47a9f61cb25611548f85086389bca1f3a2e3a240b5a264) 美国在台协会(AIT)处长谷立言接受台湾媒体专访时表示,台海两岸关系已不同于10年前,当年推动双方互动的诸多条件与诱因如今已不复存在。不过,他认为两岸关系不必然走向冲突,并强调“维持现状”仍是两岸展开对话的最佳基础。 《联合报》星期二(6月23日)刊出的专访内容中,谷立言(Raymond Greene)回顾了他2014年出任美国驻成都总领事至2024年出任AIT处长,这期间的两岸关系起伏。 他指出,2014年前后正值两岸关系高点,当时许多台湾民众赴中国大陆求学、就业和投资,外界普遍认为大陆经济发展可能缩小两岸分歧;与此同时,不少大陆年轻人向往台湾民主制度。如今,这种双向吸引力已不复存在,国际社会更担忧台海可能走向冲突。 尽管如此,谷立言认为局势变化迅速,未来10年的走向与当下相比可能又是截然不同。若能在可预见的未来维持现状,或能看到更多当前所没看到的契机。 他进一步指出,约七成台湾民众支持维持现状,主要政党在此议题上大致有共识,并支持在维持一定吓阻能力的同时推动对话。不过,民进党与国民党在两岸互动程度上存在差异,部分观点认为互动不足可能增加误判风险并错失经济机会;另一部分则担忧过度互动可能带来渗透或经济胁迫风险。相关分歧在台湾内部持续存在,也反映出民主社会对相关议题的多元讨论。 谷立言在访谈中对台湾总统赖清德多次强调支持维持现状表达肯定,并认为前总统蔡英文在凝聚台湾社会与主要政党对“支持现状”的共识方面贡献良多。 他说,正因为台湾社会对维持现状具有高度共识,美国才持续呼吁北京与台湾民选领袖展开互动。“在台湾高度共识的状态下,制造分裂不会让北京得到想要的结果。” 谷立言同时认为,北京长期坚持在展开对话前要求先接受前提条件,这种做法“不利于建设性的对话”。 针对外界关注美国对台政策及军售议题,谷立言强调,美对台政策并未改变,军售也未暂停。他说:“虽然中国(大陆)就美国军售台湾表达立场,但是美国在做决定时,不考虑中国(大陆)的立场或意见。” ### 学者:为“习郑会”“习特会”后续纷扰定调 台湾中华亚太菁英交流协会秘书长王智盛接受《联合早报》采访时分析,谷立言此次专访是在[“习郑会”]( 针对谷立言认为北京预设前提条件不利于两岸展开对话,王智盛解读,这实际上是在回应郑丽文的主张。郑丽文无论是在[今年4月与中共领导人习近平会面]( 王智盛说:“谷立言的话不是只讲给郑丽文听,也是讲给国民党内其他重要人士听,他们必须去思考,还要不要继续郑丽文的路线。” 此外,外界对台军售的争议,源于美国总统特朗普5月访华期间接受美媒采访时,[曾称军售案可作为与北京谈判的筹码](
资讯同步's avatar
资讯同步 27 mins ago
#V2EX ### [生活] 遭遇联通诈骗营销 今天接到 10016 来电,说我的手机套餐将要变成 49 元/月,现在有个优惠,巴拉巴拉…… 当前套餐是 2013 年办的校园卡,月租 9 元,自动加入校园网。当时办了 3 张,互打免费。现在主要是“保号”,毕竟月租便宜。 当时也害怕这个套餐没了。今晚问了 10010 ,说是不会自动改套餐,可以一直用的。悬着的心也放下了。 这里主要分享一下,不要轻信电话营销。
资讯同步's avatar
资讯同步 27 mins ago
#V2EX ### [分享创造] 做了一个 harness 工具 -- loopat.ai 为了感受 vibe coding 的魅力,我们在几周前开始 vibe 了一个项目: <https://loopat.ai> 目前已经开源 <https://github.com/simpx/loopat> 项目的理念大概是一个围绕 loop 这个概念做上下文管理,并且可用于多人合作的 vibecoding 工具。 说的简单点一点大概就是一个包装在 docker 内、管理和复现环境比较方便的 claudecode 外壳(目前用的就是 ClaudeCode SDK ,所以行为上和原版 cc 也很像)。 核心的理念是一套上下文的继承方式,这里说有些复杂可以看看项目。 一些比较亮点的功能可能是:移动界面支持、快速分享、基于 markdown 的 kanban 工具这些。 虽然概念上比较复杂,拿来就当一个 cc 的界面用也没什么问题。 然而前段时间忽然 Loop Engineering 的概念火了,说是 AI 交互的新范式什么的。虽然不是很明白,但是好像不小心蹭了个热度。 本着“先做个垃圾出来”的理念先搞了个大概;至于项目目前的状态,感觉高强度的 vibe 了一段时间后可能到了要做减法和打磨的时间了,在这里也想看看大家的意见,有什么问题也可以在这里提。 启动项目非常简单,运行 npx loopat (或者 bunx loopat )就行。 PS:本篇文章纯手敲,不含任何 AI 生成文本。
资讯同步's avatar
资讯同步 27 mins ago
#V2EX ### [程序员] [踩坑提醒] 还在用 Next.js 15.0.3 + React 19 的朋友,建议检查下依赖 最近在盘点手头前端项目的依赖,顺手做了一波安全审计,惊出一身冷汗。发出来给各位尝鲜 Next 15 的老哥提个醒。 ### 省流( TL;DR ): 如果你项目 `package.json` 里的依赖刚好卡在以下版本组合: * `next`: `"15.0.3"` * `react`: `"19.0.0"` * `react-dom`: `"19.0.0"` **建议立刻、马上安排升级。** --- ### 隐患背景 前阵子开新坑,为了吃 React 19 的红利,项目初期直接把依赖锁在了上面的版本。 但实际上这个特定版本的组合存在非常严重的安全漏洞。在特定的服务端渲染( SSR )或 Server Actions 场景下,恶意攻击者可以通过构造 payload ,直接绕过编译期检查向运行环境植入恶意程序。在如今满大街自动化扫描器的环境下,用这个版本组合上线无异于在公网裸奔。 ### 解决办法 直接把版本推到最新的 Patch 版: ``` npm install next@latest react@latest react-dom@latest (注:升级后切记把 node_modules 和 .next 缓存删干净重新 build ,我这边实测推上去基本是无痛兼容的,没有遇到恶心的 Breaking change 。) ```
资讯同步's avatar
资讯同步 27 mins ago
#V2EX ### [分享创造] 增强默认 select 使用体验 有些网站还在使用最基础的 select 元素,一旦选项列表过长,查找起来就会非常麻烦。于是就写了这个小工具,它会监听页面上原生 select 元素的点击事件,并用一个带有搜索功能的现代化下拉框代替交互。如果插件影响了网页的正常交互,只需按住 Alt 键即可临时禁用拦截,避免刷新页面导致填写的表单丢失。 安装地址:[better-select]( github:[better-select](https://github.com/xiyuesaves/better-select) 功能演示: ![](https://github.com/xiyuesaves/better-select/raw/main/demo/demo1.gif) ![](https://github.com/xiyuesaves/better-select/raw/main/demo/demo2.gif)
资讯同步's avatar
资讯同步 27 mins ago
资讯同步's avatar
资讯同步 28 mins ago
#V2EX ### [分享创造] [送码]OopsPlayer 升级 v2.1.0, iPhone / iPad /AppleTV 年中再次向大家分享我开发的 App ,上一次在 v 站分享还是赶在春节期间,熬了无数个夜晚把 Dolby Vision 播放正式完成后提交了第一个版本; 这半年时间,提意见提需求抱怨牢骚的友友们,我都照单全收了,v2.1.0 总算是把功能都对齐了: • 4K / HDR10 / Dolby Vision / Dolby Atmos / MKV 播放 • Emby / Jellyfin / Plex 流媒体服务器 • SMB / WebDAV / SFTP 局域网访问 • Google Drive / Dropbox / OneDrive 网盘播放 • TrueHD / DTS 无损音频 • Picture in Picture 画中画 • AirPlay 投放 • Trakt / iCloud 数据同步 • 弹幕看番追剧 • 原生硬件解码优化 送一批 Pro 兑换码,评论区领取。 App 下载地址: <https://apps.apple.com/us/app/oopsplayer/id6758075545> 有问题可以给我留言: service@oopskate.com
资讯同步's avatar
资讯同步 28 mins ago
#V2EX ### [酷工作] [成都]高级硬件工程师 工作地点:成都 #### 公司 军工相关行业,双休、高额五险一金 #### 岗位职责: 1.根据产品需求和开发计划,负责设计、开发和测试各种硬件组件和系统,确保其满足功能和性能要求。 2.负责产品硬件的选型、原理图设计,优化现有硬件系统,提高性能和稳定性。 3.负责产品板级测试和验证,协助程序调试。 4.对产品硬件可靠性、EMC 等相关疑难故障进行现象检测、机理分析、设计整改,实现故障闭环。 5.负责编写和维护主管产品硬件技术资料(如硬件设计方案、BOM 、电路原理图等),确保设计过程的标准化与可追溯性。 6.维护和⽀持硬件产品的⽣产过程,参与产品系统联调、测试、试产等验证过程,执⾏设计审查,把控产品设计质量。 7.负责提出硬件采购需求与成本控制,协助完成 PCB layout 设计和评估。 8.持续提升自⼰的技术水平,跟踪行业技术动态,持续改进现有产品硬件设计水平。 9.主动学习,参与团队内部的技术分享,促进知识共享和个人成长。 10.与其他研发人员紧密合作,确保研发工作按计划有序进行。 #### 任职要求: 1.通信工程、电子信息、电气、自动化等相关专业毕业,本科及以上学历。 2.具备 5 年以上电子产品硬件设计和开发能力。 3.掌握通信原理、模拟电路和数字电路等设计知识,有较强的电路分析能力,理论基础扎实,能够处理和解决硬件相关技术问题。 4.能够熟练使用 AltiumDesigner 、Cadence 等硬件开发 EDA 工具进行原理图设计,了解 PCB 基础设计思路,能独立进行电路调试。 5.熟悉国内外 Z7 、V7 、VU 、RFSOC 等系列 FPGA 外围电路,主流 AI 芯片、9361/9371 等数模转换芯片、时钟管理芯片等硬件设计,具有成熟产品研发经验,了解主要元器件的优缺点和成本情况。 6.熟悉外设和接口硬件设计,如 RS232/RS422/RS485 串口、1394 、1553 、RGMII 、SRIO 、光通信、以太网口、CAN 、SPI 、IIC 、USB 、各种传感器控制等。 7.熟练使用万用表、示波器、信号发生器、频谱仪等仪器,解决信号完整性、电源完整性等硬件问题。 8.主动了解行业发展,具备良好的职业道德素质和团队精神,善于沟通协作,责任心强,动手能力强,学习效率高,具备一定的抗压能力。 #### 加分项 具有军工装备项目丰富实战设计经验者优先 #### 联系邮箱 bGltaW5nemh1QHRvZ2V0aGVyd2luLmNu
资讯同步's avatar
资讯同步 28 mins ago
#V2EX ### [iPhone] 似乎是一个 BUG? iPhone 连接蓝牙后,振动反馈就变了 我喜欢给输入法开启按键振动反馈, 我有 2 个手机,iPhone15 和 iPhone15pro 我发现只要我链接蓝牙耳机听歌, 那么输入法的振动反馈就变得粘腻, 延迟,就变得不干脆了。 更换过耳机,也更换过输入法 豆包输入法和百度输入法,都存在这个问题
资讯同步's avatar
资讯同步 28 mins ago
#V2EX ### [问与答] 请教下 AI 开发的高保真视觉还原问题 最近在开发自己的小程序,主力使用 Codex,现在遇到一个问题:使用 product design 可以给出高保真效果图,但不带图层,无法切图,导致在代码实现阶段,需要花费非常多的 token 来做视觉还原校验,而且是盲目校验。我认为现阶段理想的过程是: 1、通过 product design 给出高保真 2、通过设计的 AI 能力,还原高保真并拆出图层; 3、给出切图和标注; 4、代码还原 现在有 skill 能实现这个能力吗?还是要把这几步拆开,用不同的工具实现?大家面对这个问题是怎么解决的?谢谢
资讯同步's avatar
资讯同步 29 mins ago
#财新 > 过去两年,没产品或模型就获得巨额融资的具身智能新公司不断出现,推动创业热潮 **【财新网】**具身智能领域投资热潮不断。6月23日,注册成立不到3个月的具身智能公司昆仑行机器人宣布完成3轮系列融资,累计融资数十亿元。   昆仑行3轮系列融资由高榕创投、高瓴创投、中科创星、钟鼎资本、华业资本、创新工场、心资本,及建发集团旗下建发资本联合投资。   昆仑行创始人任庚曾在华为担任缅甸分公司总经理,后加入阿里巴巴,先后担任阿里云中国区总裁和阿里云视频云&边缘云研发总裁等职务。离开阿里后,任庚曾出任新奥集团总裁。联合创始人郎咸朋曾是理想汽车高级副总裁。
资讯同步's avatar
资讯同步 29 mins ago
#财新 > 过去两年,没产品或模型就获得巨额融资的具身智能新公司不断出现,推动创业热潮 **【财新网】**具身智能领域投资热潮不断。6月23日,注册成立不到3个月的具身智能公司昆仑行机器人宣布完成3轮系列融资,累计融资数十亿元。   昆仑行3轮系列融资由高榕创投、高瓴创投、中科创星、钟鼎资本、华业资本、创新工场、心资本,及建发集团旗下建发资本联合投资。   昆仑行创始人任庚曾在华为担任缅甸分公司总经理,后加入阿里巴巴,先后担任阿里云中国区总裁和阿里云视频云&边缘云研发总裁等职务。离开阿里后,任庚曾出任新奥集团总裁。联合创始人郎咸朋曾是理想汽车高级副总裁。