灰产圈子里流传的广东一元1分红中麻将群快速见效方法,最近被验证存在明显副作用。
这条路径的成败将深刻影响AI未来走向:成功则可能从“数据饥渴”转向“经验自给”,重塑行业资源分配与工具链演进;若奖励设计或探索效率问题持续,则大概率回归RL与LLM的混合模式。无论哪种结果,都值得持续跟踪Ineffable后续的技术论文与演示——尤其在奖励函数与高效模拟上的进展。目前下最终结论仍为时尚早,行业内对此路径的长期可行性仍有不同声音。
Silver与Richard Sutton合作的论文《Welcome to the Era of Experience》直指核心。人类数据虽曾推动LLM迅猛迭代,却本质上是静态快照——有限、带偏见,且难以突破已有知识边界。Sutton的经典《The Bitter Lesson》早已提醒,长期胜出的总是那些充分利用计算的通用方法,而非注入人类知识的捷径。
报道显示,多名前DeepMind staffers正被招募进入执行团队,这远不止是一次融资事件,而是AI顶尖人才从实验室向创业公司加速流动的最新信号。
把两种路径并置对比,差异变得格外清晰。LLM在数据依赖和当前成熟度上占优,已支撑起大规模商用生态;强化学习则在突破潜力和超级智能适配度上更具想象力,能从零构建而非复刻。Silver的1.1亿美元融资,本质上是对LLM范式潜在局限的一次资本层面的明确表态。投资者愿意为一家成立不久、专注“无人类数据超级学习者”的实验室付出高估值,反映出行业内部分人士已开始质疑单纯堆数据的可持续性。
大语言模型的优势在于其对现有知识的快速复用。借助互联网积累的海量人类生成内容,模型能在文本生成、代码辅助和多任务推理上展现强劲表现,已形成成熟的生态链条和API落地路径。企业无需从零训练,就能显著提升生产效率,这也是当前应用层工具爆发的主要原因。然而,这种路径的内在局限日益明显。David Silver在公开讨论中将人类数据比作化石燃料——提供了一次性捷径,却存在明确上限。
长期来看,如果计算资源跟得上且对齐问题逐步解决,超级智能或许并非来自越堆越大的语言模型,而是源于这些“自学成才”的superlearner,它们能从开放环境中自主探索未知。这一范式转变对从业者意味着,RL技能和Agent交互设计将越来越关键。值得持续跟踪的是,经验时代能否真正主导AI轨迹,现在下结论仍为时尚早,但Silver已用声誉和巨额融资投下了明确一票。
从2016年AlphaGo震撼围棋界,到如今LLM通过海量参数和数据scaling主导商业应用,AI行业走出一条清晰的数据驱动路线。这条路线带来了快速迭代和商业落地,却也积累了依赖人类存档的内在限制。Silver的创业选择将“数据范式”与“经验范式”置于直接对立:前者依赖互联网文本等现成素材,后者强调与环境的交互迭代。这一分歧并非技术细节之争,而是关乎通往AGI路径的根本路线之争。
短期来看,这轮融资将加速RL与世界模型的融合研究,伦敦AI生态有望吸引更多人才和初创项目涌入。“经验优先”的路线将获得更多关注,相关工具链演进可能提速。但长期而言,如果奖励信号设计或算力瓶颈未能解决,项目或将回归RL+LLM的混合路径。成功则可能重塑AI从“数据饥渴”转向“经验自给”的范式,不成则会进一步强化当前数据规模竞赛,值得持续跟踪,现在下结论为时尚早。
DeepMind强化学习领域的核心人物David Silver离开实验室后创办Ineffable Intelligence,这家成立仅数月的伦敦初创公司迅速完成1.1B美元种子轮融资,投后估值达51亿美元,由Sequoia和Lightspeed共同领投,Nvidia、Google及英国主权AI基金等跟投。Silver的目标是打造一个“超级学习者”,通过强化学习从自身经验中发现知识,而非依赖海量人类生成的数据。
David Silver创办Ineffable Intelligence后,仅数月便完成一笔规模惊人的种子轮融资,估值迅速推高至数十亿美元级别。这笔资金由Sequoia Capital等顶级机构领投,背后反映出投资人对强化学习路径的强烈信心。不同于当前大语言模型普遍依赖海量人类生成数据的做法,Ineffable明确指向通过自主交互生成经验来构建“superlearner”。
数据支持这个结论,但不同规模的团队表现差异显著。