调研数据显示,列入2026年重点议题的企业比例较上年增长显著,但同期也出现更多关于实施路径的谨慎声音。理性解读的未来,仍需在实践中不断校准。
深挖问题根源,会发现不少企业的云迁移还停留在简单的“lift-and-shift”阶段,只是把原有系统原样搬到云端,没有进行必要的重构和优化。这种做法短期内看似省力,却根本无法支撑AI大规模推理、实时数据整合以及日益复杂的agent工作流。AI需要弹性算力、低延迟访问和海量数据的动态流动,而传统基础设施或简单迁移后的环境往往难以提供这些条件。早期云迁移中只搬不优化的教训,如今在AI时代有重演的风险。
深层瓶颈在于那个缺失的“中间步骤”。Anthropic的劳动市场影响研究显示,经理、建筑师等知识密集岗位的任务暴露度较高,但这更多基于理论能力而非实际表现。Mercor在2月发布的APEX-Agents基准测试则更直接:顶级模型驱动的AI代理处理银行分析师、管理咨询师和公司律师的480项真实任务时,首次尝试成功率仅约24%,即使多次重试也远未达到可靠水准。
真实用户反馈却描绘出另一幅图景。Mercor的APEX-Agents基准测试显示,即使是Gemini 3 Flash等前沿模型驱动的代理,在专业人士设计的复杂任务中也大多失败。这些任务涉及投资分析、战略咨询和公司法务,平均耗时1-2小时,依赖跨系统协作和模糊判断。问题核心在于,AI难以深度整合“污染”严重的工作流:历史数据、人工决策和例外处理交织其中,简单叠加反而增加纠错负担。
深层来看,这个缺失步骤并非单一技术鸿沟,而是“试点验证—规模化部署—P&L挂钩”三层桥梁的整体断裂。就像内裤精灵只知道收集内裤,却从未想过如何将其转化为可销售的产品并产生实际利润。企业AI项目常停留在技术验证阶段,缺乏明确的基线指标来追踪前后变化,也缺少跨部门对齐来重塑流程。AI擅长执行模式化任务,却难以替代战略判断和集成协调。没有这些中间环节,数十亿美元投入最终只能沦为昂贵的实验记录。
对企业和高管的冲击已在显现。短期内,烧钱后的失望可能冷却投资热情,甚至引发项目下马或资源调整;长期若不补上领导力这一环,AI难以成为真正的经济转型技术,普通员工和中层将继续承受流程摩擦,效率提升有限。当然,这存在不确定性——如果更多高层愿意面对组织阻力、真正审视现有流程能否被AI重塑,少数5%的成功路径或许会扩大,否则大部分企业将继续错过窗口期。值得持续跟踪,现在下结论为时尚早。
历史类比能说明这个执行差距的顽固性。早期ERP系统或自动化生产线部署时,也曾出现效率短期不升反降的情况,根源同样是未同步重构工作流程和人力适应。AI落地面临类似路径依赖:员工习惯原有节奏,AI输出需要持续人工校验,管理层又急于看到短期ROI,试点失败后容易直接砍预算。这一步“中间环节”的缺失,让技术优势难以转化为盈利闭环。
深层问题在于“缺失步骤”的本质。单纯将AI工具嵌入现有流程,往往无法释放预期价值,甚至会增加认知负荷。因为工作流不是实验室里的干净环境,而是“沾染了人和现有流程”的复杂系统。Mercor的APEX-Agents基准测试了480项真实职场任务,覆盖投资银行、咨询和公司法等领域,即使是顶级AI代理,成功率也普遍低于25%。这凸显了在需要多步骤协调和战略判断的非编码任务上,AI仍面临显著瓶颈。
对企业和高管的真实冲击已在逐步显现。短期内,更多公司将在持续烧钱后感到失望,投资热情可能冷却,甚至引发项目下马或资源重新分配。长期而言,若不补上领导力这一环,AI难以真正成为驱动经济转型的技术,普通员工与中层将继续承受工具落地与旧流程的持续摩擦,整体效率提升有限。当然,这一点目前行业内仍有不同声音:如果高层敢于面对组织阻力、推动深度重构,那么少数5%的成功案例或许会逐步扩大,否则大部分企业将继续在表演式AI中徘徊,错失窗口期。
深层问题出在那个缺失的中间步骤。Anthropic的相关研究显示,经理、建筑师等知识密集岗位的任务暴露度较高,但这些更多基于理论能力,而非真实环境表现。Mercor的APEX-Agents基准测试则更直接:顶级模型驱动的AI代理在银行分析师、管理咨询师和公司律师的480项真实任务中,首次尝试成功率仅约24%,即使多次尝试也远未达到可靠水平。AI在隔离环境中强大,在需要处理模糊性、跨系统上下文和战略判断的场景里,大多力不从心。
变革管理缺失进一步放大了这一障碍。引入AI并非简单替换工具,而是需要撕掉旧有流程重新设计,这涉及建立心理安全、持续培训、跨部门协作,甚至挑战“一直这么干”的惯性。历史上多次数字转型项目正因忽略这一人为因素而折戟,AI时代这一问题显得尤为突出,被业内称为“人因盈利障碍”。
我的判断是——但这个判断可能需要修正——那些忽略这一点的尝试,迟早会付出代价。