这也是SEO从表面竞争转向深度竞争的具体表现。
这轮融资短期内将加速RL与世界模型的融合研究,伦敦AI生态有望吸引更多人才与初创项目涌入,“经验优先”的技术路线将获得更高关注。长期来看,若Ineffable成功实现从数据饥渴向经验自给的范式转变,AI开发资源分配或将重塑,普通开发者需更多关注RL工具链演进。但若奖励信号设计失准或算力瓶颈持续,项目很可能回归RL+LLM混合路线,进而强化当前数据规模竞赛。
表面看这是名人效应叠加资本热潮的产物,但更深层信号在于,AI创业路径正在悄然分化。
Silver在DeepMind的经历提供了清晰线索。AlphaZero不依赖任何人类棋谱,通过自我对弈和试错就超越了人类在围棋、象棋等领域的巅峰水平。这一范式让他坚信,LLM本质上是人类知识的压缩机,擅长重组已有内容,却难以突破存档边界发现全新知识。Ineffable Intelligence的“superlearner”正是要延续这一逻辑:让AI通过纯粹的经验交互,像达尔文式探索那样,从空白状态构建智能机制,而非被动摄入海量文本数据。
Ineffable Intelligence的进展值得持续跟踪。Silver本人在相关表态中强调,这一“superlearner”旨在从基础运动技能到深刻智力突破,都通过自身经验发现知识,而非人类数据的捷径。这不仅是对技术路线的重新选择,也提醒整个行业:人类数据是否足够,仍是一个开放的基础命题。数据支持经验范式有潜力,但样本量和计算挑战目前仍有限,值得观察后续技术输出能否真正打开通往更通用智能的新窗口。
Silver的核心判断源于其长期研究实践。在DeepMind时期,AlphaZero不吃任何人类棋谱,却通过纯trial and error超越人类,这证明AI能在空白起点上自发现规则。如今Ineffable Intelligence的“superlearner”延续这一逻辑,目标是让系统像达尔文式探索那样,从自身经验中构建全新知识,而非作为人类知识的压缩机。
如果单纯追求短期商业价值和快速迭代,LLM仍是务实选项。它已证明自己能带来即时回报,生态也足够完善。但若目标是探索人类未知边界、构建能自我发现新原理的智能,强化学习提供的AlphaZero式启示就显得格外锐利。Silver把这称为自己的毕生事业,目标是解释并构建所有智能,堪比达尔文发现进化论的科学突破。数据支持这个方向,但样本量和早期成果仍需持续跟踪,现在下最终结论或许为时尚早。
他离开DeepMind后创立Ineffable Intelligence,仅数月便获得1.1亿美元种子轮融资,估值达到51亿美元,投资方包括Sequoia、Lightspeed、Nvidia和Google等顶级机构。这笔巨额资本直接制造了一个尖锐的行业选择困境:继续All in LLM,还是转向强化学习这条几乎不依赖人类数据的经验驱动路径?这个决策不只是技术路线之争,更是关乎AI能否突破人类知识上限、迈向真正超级智能的关键转折。
强化学习则代表了另一种从第一性原理出发的路径。它不依赖外部人类数据,而是通过与环境交互、奖励反馈和自我对弈来迭代。AlphaZero的经典案例最具说服力:在完全零人类棋谱输入的情况下,仅给定游戏规则,它就通过无数次自我对弈达到了超人类水平,并在围棋、国际象棋等复杂博弈中展现出人类难以企及的策略深度。
David Silver创办Ineffable Intelligence后,短短数月便以51亿美元估值完成11亿美元种子轮融资,这笔由Sequoia和Lightspeed领投、Nvidia等跟进的资金,远超常规早期项目规模。表面看是又一AI独角兽故事,但核心在于Silver明确放弃主流LLM依赖的海量人类数据,转向通过强化学习让系统自主生成经验。这一举动并非简单赛道切换,而是对当前AI范式极限的直接回应。
David Silver本人将人类数据比作化石燃料,提供了一次性捷径,却存在明显上限。这个判断目前行业内仍有不同声音,但我认为它点出了LLM的核心制约。
排名代发飞机【seo1268】好友聊天,输入“哪里有1元1分跑的快群”咨询客服,娱乐游戏作为民间很受欢迎的纸牌玩法,乐趣集中在快节奏的刺激感、心理博弈的张力,这两种玩法的规则几乎一学就会,不用记复杂的牌型搭配,就算是新手也能快速上手,梦想是前行的灯塔,哪怕渺小,也能指引方向。不必因梦想遥远就轻言放弃,逐梦的路上,本就布满挑战。拆分目标,步步前行,哪怕每天只前进一小步,也是在靠近理想。不惧旁人的质疑,不畏前路的漫长,坚守初心,全力以赴。只要心中有梦,眼里有光,脚下有路,终能跨越山海,奔赴心之所向的远方。在真实复杂项目环境中的有效落地实施、价值释放和能力内化,最大的现实挑战和核心日常工作,其实是如何将那些来自理论研究、行业报告或领先案例的、相对抽象、高阶、概括性的方法论框架、最佳实践经验和成功模型,有效地拆解、转化、适配成为一系列具体、可量化、简单易行、可每日重复执行、可定期检查评估并持续迭代优化的小动作、小目标、小习惯和小流程。