AI无需人类数据就能学习?David Silver新公司Ineffable技术可行性分析
- 发布时间:2026-04-28 05:19:24
- 来源:真人一块1分跑的快群资讯中心
- 栏目:新闻资讯
理论再多,也比不上一次真实的数据反馈。
如果Ineffable能有效结合世界模型,在模拟环境中高效预演试错,其突破潜力不容低估。这或许能大幅提升样本效率,避免真实世界中的危险探索循环。但短期来看,纯RL路线难以全面超越LLM,后者通过海量数据快速掌握语言与常识模式,而RL起步阶段仍需天文数字级的交互。目前算力虽持续提升,瓶颈依然存在,核心在于如何避免智能体陷入无效循环。
Ineffable Intelligence的具体技术细节尚未完全公开,但从Silver过往的Alpha系列成果和其对“经验时代”的反复阐述看,这并非一时热度,而是对AI发展路径的深思熟虑押注。行业内对这一转向的争议仍在发酵:部分观点认为LLM通过规模化和RLHF已足够强大,另一部分则认同Silver的观察,即真正的新知识必须来自机器自身的经验迭代。
年4月27日,TechCrunch等媒体报道了DeepMind强化学习元老David Silver创办Ineffable Intelligence的消息。这家伦敦实验室成立仅数月,便完成1.1亿美元种子轮融资,估值达到51亿美元。核心目标是打造“超级学习者”,完全通过强化学习从自身反复试错中自主发现知识,而非依赖人类生成的数据。
表面融资热闹背后,是人才网络的延续与转化逻辑。Silver作为强化学习领域的长期领军者,其从DeepMind招募旧将并非简单挖角,而是试图重建一个能延续并拓展过去专长的闭环团队。DeepMind早期正是凭借紧密的人才网络效应,在该领域建立领先优势。如今这一模式以创业形式重现,反映出AI行业正从scaling laws主导的大模型路径,向新学习范式转型中的人才重新配置。
团队构建上,Ineffable快速从DeepMind及其他实验室招募顶尖RL研究者,试图形成以“经验驱动”为核心的文化。这一点对普通创业者有直接启示:人才密度有时比资金更关键,尤其在技术范式切换期。跨实验室整合能加速共识建立,避免常见工程坑点,但高估值环境下的人才保留成本和文化融合压力也不容小视。我的判断是,2026年真正值钱的不是数据,而是让AI自己发现知识的能力——这一点目前行业内仍有不同声音,数据支持这个方向,但样本量仍有限。
David Silver在公开表态中将人类数据比作化石燃料——它提供了一次性捷径,却存在清晰的上限。LLM再强大,本质上仍是复用存量知识,难以生成真正原创的突破性洞见。
表面看,这是一笔欧洲AI史上罕见的早期大额融资,但其核心在于Silver对路径的选择:放弃大厂稳定的scaling LLMs框架,转向纯强化学习驱动的“superlearner”。这件事远不止人才流动那么简单,它直接触及当前AI主流信仰的脆弱点。
年4月27日TechCrunch报道,DeepMind强化学习元老David Silver创办的Ineffable Intelligence仅数月便完成1.1亿美元种子轮融资,估值达到51亿美元。公司核心目标是打造“超级学习者”,完全通过强化学习从自身反复试错中自主发现知识,而非依赖人类生成的数据。
公司明确目标是打造“superlearner”——一种完全通过纯强化学习从零自发现知识的系统,而非依赖海量人类生成数据。这件事远不止于又一例大牛创业拿大钱,它直接触及当前AI主流路径的根本假设。
这件事比又一家AI独角兽拿到巨额融资复杂得多。它直接挑战了当前LLM高度依赖海量人类数据的范式,但技术落地远非简单复制AlphaZero在游戏中的成功。Silver的路径试图让AI摆脱“抄人类”的天花板,转向纯经验驱动的自学成才。
SEO资讯站的结尾段文本批量生成如下,每行一条:
固定链接:http://www.ss7a.cn/6381.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。