这比单纯提升点击率,更接近商业本质。
这些调整虽在 4 月 20 日前后修复,但期间生成的代码质量波动已超出单纯“用着不顺手”的范畴,直接放大了 AI 生成代码的安全隐患,尤其在 Claude Code 安全编码场景下。
月23日,Anthropic发布了一份详细的工程postmortem,坦承过去一个多月Claude Code在开发者社区中频繁被反馈“变笨”、上下文遗忘严重以及token消耗异常加速。官方调查显示,这并非底层模型权重退化,而是三个产品层变更在不同时间点和流量片上叠加导致,已于4月20日通过v2.1.116版本全部修复。同时,他们宣布对所有订阅用户的使用限制进行重置。
月23日,Anthropic发布了一篇工程postmortem,详细解释了过去一个多月Claude Code被开发者广泛吐槽“变笨”、输出重复以及token消耗异常加速的现象。官方承认这些问题并非底层模型退化,而是三个产品层变更在不同时间点叠加导致,已于4月20日通过v2.1.116版本全部修复。同时,他们宣布为所有订阅者重置使用限制。
Anthropic的报告拆解了三个重叠变更。3月4日,reasoning effort默认值从high降至medium,本意是减少UI卡顿,却让Opus 4.6和Sonnet 4.6的思考深度受损。Opus 4.7后续默认xhigh,受影响相对较小。4月7日回滚后,优先保障智能而非一味压延迟。这个调整直接放大了不同版本的敏感度差异。
表面上看,用户在 Hacker News、Reddit 和知乎等平台集中吐槽 Claude Code “越聊越傻”,token 消耗异常增加,工具调用频繁出错。主流观点倾向于归因模型降智或提示词不佳,但忽略了具体工程变更的叠加影响。很多人只看到症状,却少有人第一时间追到 3月26日这个缓存优化的实现细节。
表面上看,用户吐槽主要集中在代码智能下降、会话健忘以及token快速耗尽上。复杂任务的规划与实现不如以往稳健,长对话中上下文连贯性变差,导致重复思考和前后不一致的情况频发。不少开发者甚至暂停使用近一个月,转向其他工具。社区早期讨论多停留在“模型似乎变笨了”的直观感受,或怀疑是单个bug所致,却忽略了三个变更的分时段影响——不同用户因模型版本、使用习惯和会话时长的差异,体验到的退化程度并不均匀,这也让问题显得既广泛又零散。
过去一个月,不少开发者在使用Claude Code进行多轮编码时明显察觉到异常。原本连贯的迭代流程,突然出现模型反复忘记先前决策路径、工具调用循环出错、代码建议重复的情况,token消耗也远超预期。
从短期看,重置相当于给所有Plus、Pro、Business和Enterprise订阅者额外几天到一周的“免费”额度,具体取决于个人用量习惯。这能快速缓解项目卡住的焦虑,让团队安心追赶关键任务,尤其对用量中等的开发者而言,修复后的工具体验已明显回升。但长期来看,如果类似事件反复出现,订阅价值感的提升可能被信任成本的累积所抵消。
除了核心缓存bug,另外两个改动也加剧了质量下滑。3月4日默认reasoning effort从high降至medium,本意减少长latency和token消耗,却让模型在复杂编码任务中显得不够敏锐;4月16日新增系统prompt限制verbosity,要求tool calls间文本不超过25词、最终响应不超过100词,对编码质量造成可量化的下降。这些变化影响不同流量切片和时间段,叠加后形成了看似随机的退化现象。
反之,若 Anthropic 落实新承诺,如创建 @ClaudeDevs 账号、加强 GitHub 更新和渐进 rollout,或许能成为正面标杆。
数据支持这个判断,但样本的行业覆盖度仍有待提升。