Sortpackage G2_90d Policy Checkpoints

本仓库保存用于具身智能分拣包裹实验的 inference-only policy checkpoint。当前推荐候选是 step56000/

目标机器人

  • 机器人配置:G2_90d
  • 夹爪:90D 新夹爪
  • 运行环境:GenieSim / G2 90D gripper 仿真环境
  • 推荐策略提示词:Sort Packages

目标任务

策略用于 sorting_packages_continuous / Sort Packages 任务:机器人在桌面或仓储工作台场景中抓取包裹/盒子,并尝试完成向右转腰和放置/分拣流程。

Checkpoints

round2_step85000/
step56000/

每个 checkpoint 均只包含推理所需文件,不包含 optimizer state 或训练分片缓存。

step56000/ 文件结构:

step56000/model.safetensors
step56000/metadata.pt
step56000/assets/pi05_popcorn_21d/norm_stats.json
step56000/assets/pi05_sort_packages_combined_21d/norm_stats.json

其中 pi05_sort_packages_combined_21d 是原始 asset 名,pi05_popcorn_21d 是为了兼容当前 runtime 默认查找路径而保留的一份同内容 norm_stats.json

当前模型选择结论

按同一规格评测:自然光 6500K / 1000,prompt 为 Sort Packages,新夹爪环境,无 mapper,seeds 为 1 11 21 31 41 51 61 71,每个权重 32 局。

权重 抓取 E2E upright inside 抓后右转腰部
round2_step85000 4/32 0/32 1 0 0
step56000 3/32 0/32 2 1 1
step64000 2/32 0/32 1 0 0

明确选择:step56000 是当前最佳候选。它的抓取率低于旧 round2_step85000,但它是唯一出现 inside=1 和抓取后明显右转腰部的权重,更接近完整分拣流程。round2_step85000 适合作为抓取率较高的基线;step64000 弱于 step56000

当前评测仍未出现 E2E 成功,因此这些权重更适合作为研究和继续调试的 checkpoint,而不是稳定生产策略。

Action 维度对应

策略输出为 21 维动作。在当前 G2_90d 新夹爪环境中使用直接布局,不需要旧 motion mapper,也不需要对夹爪做 relabel。

维度 关节/含义
0 idx21_arm_l_joint1
1 idx22_arm_l_joint2
2 idx23_arm_l_joint3
3 idx24_arm_l_joint4
4 idx25_arm_l_joint5
5 idx26_arm_l_joint6
6 idx27_arm_l_joint7
7 idx61_arm_r_joint1
8 idx62_arm_r_joint2
9 idx63_arm_r_joint3
10 idx64_arm_r_joint4
11 idx65_arm_r_joint5
12 idx66_arm_r_joint6
13 idx67_arm_r_joint7
14 idx32_gripper_l_outer_joint1
15 idx72_gripper_r_outer_joint1
16 idx01_body_joint1
17 idx02_body_joint2
18 idx03_body_joint3
19 idx04_body_joint4
20 idx05_body_joint5

维度分组:

  • 0:14:G2 左右双臂 14 个关节,左臂 7 维后接右臂 7 维。
  • 14:16:90D 左右夹爪 2 维。
  • 16:21:G2 腰部/躯干 5 维,运行时对应 idx01_body_joint1idx05_body_joint5

推理说明

容器内可将目标 checkpoint 挂载到 runtime 默认目录:

/home/syf/popcorn_pi05_best_9000

策略服务 prompt 建议固定为:

Sort Packages

注意事项

  • 面向 G2_90d 新夹爪布局;不要按旧 idx41/idx81 夹爪接口使用。
  • 当前布局下不需要旧 motion mapper。
  • step56000 是当前最佳整体候选,但 E2E 仍为 0/32,需要继续前台复现和定位。
Downloads last month

-

Downloads are not tracked for this model. How to track
Video Preview
loading