九游会J9·(china)官方网站-真人游戏第一品牌

J9九游国际站LeCun怒揭机器人最大骗局坦白|横山知枝|Llama与我无瓜!

  j9九游会 - 真人游戏第一品牌✿◈◈◈,J9九游国际站✿◈◈◈。J9九游会✿◈◈◈,【新智元导读】一场公开演讲✿◈◈◈,LeCun毫不留情揭穿真相✿◈◈◈:所谓的机器人行业✿◈◈◈,离真正的智能还远着呢✿◈◈◈!这番话像一枚深水炸弹✿◈◈◈,瞬间引爆了战火✿◈◈◈,特斯拉✿◈◈◈、Figure高管纷纷在线回怼✿◈◈◈。

  机器人在工厂里拧螺丝✿◈◈◈、搬货等✿◈◈◈,可通过特定任务训练实现✿◈◈◈,但让它们在家中叠衣服✿◈◈◈、倒水✿◈◈◈、理解人的意图横山知枝✿◈◈◈,还很难✿◈◈◈。

  而突破的核心✿◈◈◈,在于打造一款真正可以规划的「世界模型」架构✿◈◈◈,即能够学习理解和预测物理世界系统✿◈◈◈。

  谁曾想✿◈◈◈,LeCun这番话再次捅了「马蜂窝」✿◈◈◈,直接给这场狂热泼了一盆冷水✿◈◈◈,引机器人界大佬上阵怒喷✿◈◈◈。

  Figure创始人Brett Adcock直接喊话✿◈◈◈,「谁去和LeCun说一声✿◈◈◈,让他别端着了✿◈◈◈,亲自下场干点实事吧」✿◈◈◈!

  上大学时✿◈◈◈,他有点偶然地发现横山知枝✿◈◈◈,原来早在50-60年代✿◈◈◈,包括1981年诺奖得主David H. Hubel和Torsten N. Wiesel等人✿◈◈◈,就已经开始思考「自组织」的问题——也就是系统如何自我组织学习✿◈◈◈。

  我一直认为✿◈◈◈,生物学给工程提供了很多灵感✿◈◈◈。在自然界中✿◈◈◈,所有活着的东西都有适应能力✿◈◈◈,只要有神经系统就能学习✿◈◈◈。

  所以✿◈◈◈,我当时想✿◈◈◈,也许我们人类没那么聪明✿◈◈◈,构建智能系统最靠谱的方法横山知枝✿◈◈◈,可能是让它自己学会变聪明✿◈◈◈。

  人工智能领域在1990至2000年代经历「寒冬」✿◈◈◈,但2013年LeCun加入FacebookJ9九游国际站✿◈◈◈,创立FAIR(Facebook AI Research)✿◈◈◈,并推动「深度学习」这一术语取代「神经网络」J9九游国际站✿◈◈◈,标志着产业界开始系统性地接受这一范式横山知枝✿◈◈◈。

  2018年✿◈◈◈,因在概念与工程领域的突破性贡献✿◈◈◈,他让深度神经网络成为计算技术的关键组成部分✿◈◈◈,和Bengio✿◈◈◈、Hinton共享图灵奖✿◈◈◈。

  他指出✿◈◈◈,文本属于「低带宽」数据源✿◈◈◈,「仅靠文本训练永远无法实现人类水平智能」✿◈◈◈。真正的智能来源于高带宽的感知输入——视觉✿◈◈◈、听觉✿◈◈◈、触觉等多模态经验✿◈◈◈,而非低维度的离散符号✿◈◈◈。

  他进一步指出J9九游国际站✿◈◈◈,LLM有时虽能提供实用的结果✿◈◈◈,甚至让人误以为其「智商堪比博士」✿◈◈◈,但这些系统只是「回忆」训练中的信息✿◈◈◈。

  LeCun指出✿◈◈◈,大语言模型(LLM)存在本质瓶颈——虽然形式上通过「学习」取代了显式编码✿◈◈◈,但仍依赖人类知识的间接转移✿◈◈◈。

  他强调✿◈◈◈,即便猫的大脑仅含约2.8亿个神经元✿◈◈◈,其对物理世界的理解与行动规划能力仍远超当前AI系统✿◈◈◈。

  猫能感知三维空间✿◈◈◈、判断物体稳定性✿◈◈◈、规划复杂动作✿◈◈◈,而目前的所有生成式模型恰恰无法企及这些能力✿◈◈◈。

  就好比✿◈◈◈,让一个机器人冲一杯咖啡J9九游国际站✿◈◈◈,它需要想象一系列动作——拿起杯子✿◈◈◈、倒水✿◈◈◈、搅拌✿◈◈◈,并预测每一步的结果✿◈◈◈。

  同时横山知枝✿◈◈◈,系统可结合一个「代价函数」(cost function)✿◈◈◈,用于评估特定任务的完成情况✿◈◈◈。

  在此基础上J9九游国际站✿◈◈◈,可运用优化方法✿◈◈◈,搜索能够优化任务目标的最优动作序列✿◈◈◈,这一过程即为「规划与最优控制」J9九游国际站✿◈◈◈。

  实验已证明✿◈◈◈,可以用世界状态的表示——来自现有模型DINO✿◈◈◈,无论是从零开始学习✿◈◈◈,还是基于V-JEPA 2等框架✿◈◈◈,都可以做到这一点✿◈◈◈。

  机器人不用针对特定任务反复训练✿◈◈◈,只需从模拟数据或真实操作中学习「动作-结果」的关系✿◈◈◈,就能零样本完成新任务✿◈◈◈。

  主持人一听✿◈◈◈,马上话锋一转打了个圆场横山知枝J9九游国际站✿◈◈◈,「没关系✿◈◈◈,我们不担心那些公司✿◈◈◈。而且说真的✿◈◈◈,我们非常信奉创业精神」✿◈◈◈。

  他将Figure的技术路径与同行对比✿◈◈◈,直言某些公开演示只是「戏剧表演」或预设程序J9九游国际站✿◈◈◈。相反✿◈◈◈,Figure机器人的所有操作都「由神经网络驱动」✿◈◈◈。

  耐人寻味的是✿◈◈◈,在一个关键问题上的判断与Yann LeCun不谋而合✿◈◈◈:他也否认制造业是主要突破方向✿◈◈◈,并指出「人形机器人当前的竞争焦点在于谁能攻克通用机器人技术」✿◈◈◈。

  据报道✿◈◈◈,特斯拉正在建设年产百万台Optimus机器人的生产线年初推出具备「量产意向」的V3原型机✿◈◈◈。

  在最近的计算机视觉顶会ICCV✿◈◈◈,特斯拉AI负责人Ashok Elluswamy详细介绍了公司的「神经世界模拟器」——一个通过车队视频数据训练的端到端系统✿◈◈◈。

  不同于传统模型根据状态预测动作✿◈◈◈,神经世界模拟器能够基于当前状态与后续动作✿◈◈◈,直接合成未来状态✿◈◈◈。

  Elluswamy确认✿◈◈◈,这套被视作世界模型问题直接解决方案的架构✿◈◈◈,将「无缝迁移」至Optimus机器人✿◈◈◈。

  Yann LeCun的论断看似否定了整个人形机器人领域✿◈◈◈,但已有企业公开将其研发方向与他倡导的「世界模型」概念对齐✿◈◈◈。

  如图所示✿◈◈◈,1X世界模型包含视觉编码器✿◈◈◈、动作编码器✿◈◈◈、核心网络✿◈◈◈,以及视频与状态价值解码器✿◈◈◈。通过对成功标签进行监督学习生成的状态价值预测✿◈◈◈,可对输入动作的质量进行量化评估✿◈◈◈。

  首席执行官Bernt Børnich在播客中坦言✿◈◈◈,让机器人进入家庭存在「理想与现实的落差」✿◈◈◈,指出「现实环境复杂得离谱」✿◈◈◈,甚至「Wi-Fi连接问题比机器人技术本身更棘手」✿◈◈◈。

  这种务实立场✿◈◈◈,结合其轻量级肌腱驱动设计所带来的安全性优势✿◈◈◈,暗示着行业清醒认识到✿◈◈◈:Yann LeCun所说的「突破性进展」仍需要持续探索✿◈◈◈。

  Yann LeCun的警告✿◈◈◈,最终重新定义了人形机器人竞赛的维度✿◈◈◈:胜利者✿◈◈◈,或许不属于推出最炫酷demo或设定最激进量产目标的厂商✿◈◈◈,而将属于那个率先攻克机器理解物理世界这一根本性难题的探索者✿◈◈◈。

  搞笑的是✿◈◈◈,主持人前一句还在夸「Llama的诞生让世界AI民主化」✿◈◈◈,话音还没落✿◈◈◈,LeCun就在旁边急着插话——

  接着✿◈◈◈,他分享了幕后故事✿◈◈◈,「第一代Llama✿◈◈◈,其实有一点像『海盗』项目(pirate project)✿◈◈◈,与官方LLM并行开发」✿◈◈◈。

  最后✿◈◈◈,在2023年初✿◈◈◈,小扎下定决心组建了一个GenAI团队✿◈◈◈,也就如今的「超级智能实验室」(MSL)的前身✿◈◈◈,主要就是为了把它产品化✿◈◈◈。

  现场✿◈◈◈,主持人再次圆话✿◈◈◈,「但最后能跑出来的✿◈◈◈,往往还是『臭鼬工厂』(Skunk Works)这种模式」✿◈◈◈。