{label:top}
首页 >> 风汇台> 正文

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

来源:风汇台发布时间:2025-09-09 04:08:41
浏览:883

斯坦福大学的家务机器将再键变 Chelsea Finn 团队又出新成果了。

Chelsea Finn 团队一直是人或斯坦福走在具身智能研究前沿的团队之一,之前火遍全网的更新 ALOHA 炒菜机器人就是出自这个团队之手。团队领头人 Chelsea Finn 的队推创业公司 Pi 更是创立不到一个月就拿下来自红杉资本、OpenAI 等公司的出B聪明7000万美元融资。雷峰网雷峰网(公众号:雷峰网)

最近,新运武汉医科大学绯闻价格Chelsea Finn 团队在研究中发现,算规虽然延长动作块能够提升策略捕捉时间依赖性的则机能力,但这样做会减少对机器人近期状态的器人观察,导致在随机环境中更容易出错。家务机器将再键变

为了克服这个难题,人或他们开发了一种双向解码(Bidirectional Decoding,更新 BID)新型运算规则。BID 能将动作块化与闭环操作相结合,队推通过在每个时间步采样多个预测并寻找最优化的出B聪明一个,增强扩展序列的新运时间一致性,同时在随机环境中实现自适应重新规划。

为了验证 BID 运算规则的效果,他们在 Franka Kitchen 信息集上进行了模拟测试,长沙中学曝光攻略发现机器人在家庭环境中的表现还不错。他们还用 Franka Panda 机器人做了真实实验,结果显示 BID 显著提高了机器人在目标移动时的放置成功率。

这些测试不由得让人联想到了他们之前做的炒菜机器人,也许这个团队正计划把 BID 应用在 ALOHA 上,准备给家务机器人来个全面的工艺升级。

值得一提的是,这个团队中有一半都是华人面孔,之前开发 ALOHA 的也全是华人学生。

目前,论文已在arXiv公开,相关代码也已开源。

论文标题:Bidirectional Decoding:Improving Action Chunking via Closed-Loop Resampling

论文地址:https://bid-robot.github.io/static/BID_paper.pdf

项目网站:https://bid-robot.github.io/

代码地址:https://github.com/YuejiangLIU/bid_diffusion

                 https://github.com/Jubayer-Hamid/bid_lerobot


论文概览

研究问题

本文旨在解决机器人学习中的挑战,特别关注动作分块,即在没有中间重新规划的情况下预测和执行动作序列的过程,这些序列通常来源于人类示范。面临的挑战包括在捕捉时间依赖性与对随机环境中意外变化的反应之间的权衡,以及不同示范之间的风格变异性较大。

该研究的动机在于通过对动作分块进行更深入的分析和提供实用的解码运算规则,来增强机器人系统的学习和执行过程。所要解决的问题包括:

动作分块中时间依赖性与反应性之间的权衡

不同示范之间的风格变异性较大

需要一种实用的解码运算规则以提升机器人行为克隆的性能。

提出的方法

本文提出了双向解码(BID)方法。

BID 是一种推理运算规则,将动作分块与机器人学习中的闭环操作相结合。它在每个时间步采样多个预测,并基于向后一致性(与先前决策的对齐)和向前对比(与更强策略的结果的接近度)来优化选择。

这种综合方法增强了长动作序列的时间一致性,同时保持了适应动态环境变化的灵活性。BID在各种机器人任务中显著优于现有的闭环方法,代表了机器人系统学习和执行过程的重大改进。


实验与结果

信息集

本文在三个信息集上进行了实验:Push-T、RoboMimic 和 Franka Kitchen。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

对于Push-T信息集,本文在七个任务上评估了所提出的双向解码(BID)运算规则,包括将物体放入人类手持的杯子中。实验中使用的机器人是Franka Panda,配备了两台相机,提供256 x 256像素分辨率的视觉观察。本文还评估了BID在大批量和现有推理方法下的可扩展性和兼容性。

对于RoboMimic信息集,本文使用了五个任务,即Lift、Can、Square、Transport和Tool Hang。每个任务的训练信息集包含300个从多个人类演示中收集的回合。

对于Franka Kitchen信息集,本文在涉及四个或更多物体的测试案例上评估了学习到的策略,这是一个具有挑战性但在家庭环境中实际应用的机器人操作任务。


真实世界实验

本文还通过两项现实世界实验进一步评估了提出的 BID。


动态放置实验

他们共收集了150个演示回合,包括50个干净且一致的演示和100个嘈杂且多样的演示。实验中使用的机器人是 Franka Panda,并采用基于视觉的扩散策略进行操作。

机器人的任务是将其抓手中的物体送入人类手中的杯子中。每次演示包括四个主要阶段:(a) 随机初始化机器人位置,(b) 接近目标杯子,(c) 在目标杯子附近减速,(d) 释放物品。目标杯子的位置可能会在演示过程中发生变化。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

值得注意的是,BID 在动态设置中的成功率与静态设置相似,这表明它有可能将动作块扩展到不确定环境中。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明


动态拾取实验

本文评估了不同方法的性能,包括普通的开环和闭环采样、BID 的开环和闭环采样,以及 EMA 的闭环采样。

机器人的任务是拿起一个杯子,并将其放在附近的碟子上。四个主要阶段是:(a) 初始化机器人,(b) 接近目标杯子,(c) 抓住目标杯子,(d) 拿起杯子,(e) 将杯子放到目标碟子上。目标杯子的位置可能会在一个过程中发生变化。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

结果表明,在动态环境中,相比其他方法,BID 的成功率至少提高了2倍,同时在静态环境中保持了其性能。


BID工艺解读

动作分块有利于对演示中的时间依赖性建模,但却牺牲了对随机环境中意外状态的反应能力。他们选择通过闭环操作衔接长的动作块来解决这一问题。

他们的主要假设是,虽然任何一对样本共享相同潜在策略的概率很低,但从大量样本中找到一致的一对样本的可能性要高得多。这种直觉促使他们将闭环动作分块问题理解为在每个时间步采样的一批计划中寻找最优动作。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

其中 ? 是动作块集合,ℒ? 和 ℒ? (B和F都是下标,飞书文档打不出来)是两个衡量时间依赖性的标准,接下来将会详细描述这两个标准。

B指的是逆向一致性。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

这里,ρ 是一个衰减超参数,用于解释不确定性随时间增长而增加的情况。这种后向损失鼓励相邻步骤之间采用类似的潜在策略,同时允许逐步适应不可预见的过渡动态。

 指的是正向对比度。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

其中 ?+=?∖{?} 是强策略 ? 预测的正集合,?− 是弱策略 ?′ 预测的负集合,而 ? 是样本大小。

下图展示了逆向一致性和正向对比度标准对样本选择的作用。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

由于 BID 中的所有步骤都可以并行计算,因此在现代 GPU 设备上,总体计算成本仍然适中。


团队介绍

Chelsea Finn

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Chelsea Finn 博士毕业于加州大学伯克利分校,师从Sergey Levine。她曾在 Google DeepMind 工作过 6 年,现在担任斯坦福大学计算机科学与电子工程系的助理教授,也是 Pi 的联合创始人。

Chelsea Finn 的研究兴趣是机器人和其他代理通过学习和交互增长广泛智能行为的能力。她的实验室 IRIS 专注研究大规模机器人交互智能,隶属于 SAIL 和 ML Group。

团队其他三位华人学生包括:


Yuejiang Liu

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Yuejiang Liu 是 IRIS 实验室的博士后,博士毕业于瑞士洛桑联邦理工学院。他专注于研究自监督学习、因果表征学习和测试时间适应,并将其应用于计算机视觉和多代理系统。


Annie Xie

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Annie Xie 毕业于加州大学伯克利分校,曾在伯克利机器智能研究 (BAIR)实验室和 Sergey Levine 一起工作,现在是 Chelsea Finn 指导的博士生。她的研究重点是开发在最少人工监督下学习的机器人系统。


Maximilian Du

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Maximilian Du 今年学士毕业于斯坦福大学,主修计算机科学、心理学(辅修)和创意写作(辅修),在 Chelsea Finn 的 IRIS 实验室从事机器人学习工作,现在是 Chelsea Finn 即将入学的博士生。雷峰网雷峰网


雷峰网版权文章,未经授权禁止转载。详情见转载须知。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

快集

更多 >
  • 腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
    更新:2025-09-09 03:03
  • AI 陪伴赛道,会诞生下一个“泡泡玛特”吗?
    更新:2025-09-09 02:24
  • 北京推出24项新举措提振消费
    更新:2025-09-09 01:57
  • 中俄外长会晤后,扎哈罗娃用了个谐音梗
    更新:2025-09-09 01:51

热门文章

  • 腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
    腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑

    腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑

    7月27日,2025世界人工智能大会腾讯论坛期间,腾讯 Robotics X 实验室与福田实验室联合发布具身智能平台Tairos钛螺丝)。雷峰网(公众号:雷峰网)AI科技评论获悉,其由模型算法和云服务 ...

  • 王毅就“南海仲裁案”阐明中方立场
    王毅就“南海仲裁案”阐明中方立场

    王毅就“南海仲裁案”阐明中方立场

    2025年7月11日,中共中央政治局委员、外交部长王毅在吉隆坡出席东亚合作年度系列外长会时就“南海仲裁案”阐明中方立场。王毅表示,菲律宾单方面提起的“南海仲裁案”,没有履行事先充分交换意见的必要前提, ...

  • 经济日报:警惕“育儿焦虑”营销,掉进商家陷阱
    经济日报:警惕“育儿焦虑”营销,掉进商家陷阱

    经济日报:警惕“育儿焦虑”营销,掉进商家陷阱

    当前,“机能鞋”“学步鞋”等品类在童鞋市场热炒,卖点多为“对脚部发育有好处”“减少摔跤次数”“矫正步态”,价格从数百元到上千元不等,吸引不少家长买单。从产品设计看,学步鞋前掌易弯折、后跟支撑强化,有其 ...

  • “未婚女子退税时发现自己被结婚8年”,警方通报
    “未婚女子退税时发现自己被结婚8年”,警方通报

    “未婚女子退税时发现自己被结婚8年”,警方通报

    7月12日,含山县公安局发布警情通报,内容如下:2025年7月11日晚,我局工作中发现有网络平台反映“未婚女子退税时发现自己被结婚8年”相关信息,立即组织核查。经初查,我县黎某女,37岁)于2017年 ...

  • 京产电影《捕风追影》获赞“近十年最好看的动作片” 成龙梁家辉“打”出新高度
    京产电影《捕风追影》获赞“近十年最好看的动作片” 成龙梁家辉“打”出新高度

    京产电影《捕风追影》获赞“近十年最好看的动作片” 成龙梁家辉“打”出新高度

    来源标题:京产电影《捕风追影》获赞“近十年最好看的动作片” 成龙梁家辉“打”出新高度电梯里的跟踪与反跟踪戏。导演杨子。京产电影《捕风追影》上映5天,票房破3亿元,被观众誉为“近十年最好看的 ...

  • 中缅双方联手打击,缅北白家犯罪集团被提起公诉
    中缅双方联手打击,缅北白家犯罪集团被提起公诉

    中缅双方联手打击,缅北白家犯罪集团被提起公诉

    [环球时报驻缅甸特约记者 陈纹洁]经过中缅双方执法合作和一系列打击行动,缅北果敢“四大家族”犯罪集团遭毁灭性打击,白家犯罪集团专案已被侦破。微信公众号“深圳市人民检察院”11日发布消息表示,已对白家犯 ...

  • 美国宾夕法尼亚州911支持出现间歇性中断
    美国宾夕法尼亚州911支持出现间歇性中断

    美国宾夕法尼亚州911支持出现间歇性中断

    当地时间7月11日,美国宾夕法尼亚州各地的消防部门和县级紧急中心正在通知公众,全州911支持中断。宾夕法尼亚州紧急事务运营局称,该州911支持出现了间歇性中断。央视记者 许骁) ...

  • 腾讯云副总裁曹磊:以云为载体,推动大模型走入产业全链条
    腾讯云副总裁曹磊:以云为载体,推动大模型走入产业全链条

    腾讯云副总裁曹磊:以云为载体,推动大模型走入产业全链条

    “制造业是中国实体经济高质量发展的基石,在新的技术变革浪潮下,制造业正加速转型升级”。9月27日,第十二届五洲工业发展论坛现场,腾讯云副总裁、智能制造负责人曹磊接受采访时表示。自2018年腾讯拥抱产业 ...

风站趣

更多 >
  • Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈
    Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈

    那个因为腰痛而坐不下的男人,终于还是在WAIC坐下了,对面则是同为图灵奖得主、上海期智研究院院长姚期智先生。Geoffery Hinton给大家带来了几个话题与故事,几乎每一个都是关于人与AI的。第一 ...

  • 手机大模型爆发:vivo 发布自研蓝心大模型,参数追赶 GPT
    手机大模型爆发:vivo 发布自研蓝心大模型,参数追赶 GPT

    11月1日vivo开发者大会上,vivo发布自研AI"蓝心"大模型,并发布大模型矩阵,包括1750亿、1300亿、700亿、70亿、10亿五款不同参数规模的大模型,并宣布130亿蓝 ...

  • 国产端侧小模型超越 GPT
    国产端侧小模型超越 GPT

    在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其中围绕具身智能的一个普遍疑问是:若将 AI 大模型应用到消费级机器人领域,首先是模型适配终端,还是终端适配模型?过去一年,由 ...

  • 漠河,都要装空调了?
    漠河,都要装空调了?

    来源:中国新闻周刊“游客说我来漠河避暑,结果快中暑了。” 近日,漠河某旅行工作室负责人黄琴在接待外地游客时,听到了这样一句调侃。近期,我国多地遭遇显著高温天气。6月以来,华北平原高温持续发展,多地进入 ...

  • 老年人免费乘公交,撑不住了?
    老年人免费乘公交,撑不住了?

    来源:中国新闻周刊近日,吉林省德惠市发布的一则《免费老年卡错峰出行通知》引发了社会关注。该通知提到,因早晚高峰时间段公共交通拥挤,无法保证上学、通勤人群的刚性出行需求,计划自9月1日起对持有免费“老年 ...

  • 东亚女儿最难以接受的真相,被她笑着戳破了
    东亚女儿最难以接受的真相,被她笑着戳破了

    第一次参加线上节目时,脱口秀演员小蝶入行3年。她站在台上,试图熟悉舞台的节奏。她讲了小时候差点被父母送养的故事,并自称是妈妈做完绝育手术后出生的“医疗事故”。这个故事早在去年年初就被网友发帖,上过热搜 ...

  • 西藏吉隆口岸泥石流致中方17人失联,均为施工人员
    西藏吉隆口岸泥石流致中方17人失联,均为施工人员

    来源:南方周末自2025年7月8日起,救援力量不停搜救失联人员,已超过60小时。“吉隆发布”微信公众号/图)“还是一直联系不上,应该是出事了。”因为哥哥在西藏务工的缘故,卢蒙枝平时会主动留意当地新闻。 ...

  • 法国就社交媒体平台X涉嫌“外国干涉”展开调查
    法国就社交媒体平台X涉嫌“外国干涉”展开调查

    当地时间7月11日,法国巴黎检察院发布新闻公报说,社交媒体平台X原推特)被举报操纵运算规则,以实施外国干涉行为,对此巴黎检察院已展开调查。公报说,一名法国国民议会议员和一名高级官员举报了X平台。在核查 ...

  • 宣布重大收购预案 开普云连续两日“20CM”涨停
    宣布重大收购预案 开普云连续两日“20CM”涨停

    每经记者 吴泽鹏 每经编辑 文 多8月25日,复牌的开普云SH688228,股价94.75元,市值63.97亿元)开盘即涨停。前一天晚间,开普云披露了重大资产购买暨关联交易预案,上市公司计划收购深圳市 ...

  • 中暑就喝藿香正气?这些解暑药的用法与禁忌要知道
    中暑就喝藿香正气?这些解暑药的用法与禁忌要知道

    7月20日入伏后,一年中最潮湿闷热的“烤验期”即将上线。购置祛暑药品成了当下热门的健康防护选择。数据显示,某外卖平台的防暑药品订单量月环比增长超120%。不过,热销的背后也藏着疑问,不少人把藿香正气类 ...

  • 广州英华思力翻译被日籍教练职场霸凌导致猝死,妻子发文维权
    广州英华思力翻译被日籍教练职场霸凌导致猝死,妻子发文维权

    7月12日,微博ID为“昨日蓝风”的博主发布长文,曝光了自己的丈夫作为广州英华思力的翻译被日籍教练长期职场霸凌,最终猝死。全文如下讨回公道!中国翻译徐进兢兢业业,被日本籍教练芳贺敦长达一年多的职场霸凌 ...

  • 经济日报:警惕“育儿焦虑”营销,掉进商家陷阱
    经济日报:警惕“育儿焦虑”营销,掉进商家陷阱

    当前,“机能鞋”“学步鞋”等品类在童鞋市场热炒,卖点多为“对脚部发育有好处”“减少摔跤次数”“矫正步态”,价格从数百元到上千元不等,吸引不少家长买单。从产品设计看,学步鞋前掌易弯折、后跟支撑强化,有其 ...

热闻62岁李连杰突发,已交代身后事
深瓜美国宾夕法尼亚州911支持出现间歇性中断
独趣一女子翻墙进酒店房间!男艺人方严正声明:警方已介入
乐点杨少华去世之前,还忙着给儿子赚钱!
专报WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快
短榜40岁,她终于等到第一个影后:“我自己的路自己走”

风汇谈

更多 >