Sortpackage G2_90d Policy Checkpoints
本仓库保存用于具身智能分拣包裹实验的 inference-only policy checkpoint。当前推荐候选是 step56000/。
目标机器人
- 机器人配置:
G2_90d - 夹爪:90D 新夹爪
- 运行环境:GenieSim / G2 90D gripper 仿真环境
- 推荐策略提示词:
Sort Packages
目标任务
策略用于 sorting_packages_continuous / Sort Packages 任务:机器人在桌面或仓储工作台场景中抓取包裹/盒子,并尝试完成向右转腰和放置/分拣流程。
Checkpoints
round2_step85000/
step56000/
每个 checkpoint 均只包含推理所需文件,不包含 optimizer state 或训练分片缓存。
step56000/ 文件结构:
step56000/model.safetensors
step56000/metadata.pt
step56000/assets/pi05_popcorn_21d/norm_stats.json
step56000/assets/pi05_sort_packages_combined_21d/norm_stats.json
其中 pi05_sort_packages_combined_21d 是原始 asset 名,pi05_popcorn_21d 是为了兼容当前 runtime 默认查找路径而保留的一份同内容 norm_stats.json。
当前模型选择结论
按同一规格评测:自然光 6500K / 1000,prompt 为 Sort Packages,新夹爪环境,无 mapper,seeds 为 1 11 21 31 41 51 61 71,每个权重 32 局。
| 权重 | 抓取 | E2E | upright | inside | 抓后右转腰部 |
|---|---|---|---|---|---|
round2_step85000 |
4/32 | 0/32 | 1 | 0 | 0 |
step56000 |
3/32 | 0/32 | 2 | 1 | 1 |
step64000 |
2/32 | 0/32 | 1 | 0 | 0 |
明确选择:step56000 是当前最佳候选。它的抓取率低于旧 round2_step85000,但它是唯一出现 inside=1 和抓取后明显右转腰部的权重,更接近完整分拣流程。round2_step85000 适合作为抓取率较高的基线;step64000 弱于 step56000。
当前评测仍未出现 E2E 成功,因此这些权重更适合作为研究和继续调试的 checkpoint,而不是稳定生产策略。
Action 维度对应
策略输出为 21 维动作。在当前 G2_90d 新夹爪环境中使用直接布局,不需要旧 motion mapper,也不需要对夹爪做 relabel。
| 维度 | 关节/含义 |
|---|---|
| 0 | idx21_arm_l_joint1 |
| 1 | idx22_arm_l_joint2 |
| 2 | idx23_arm_l_joint3 |
| 3 | idx24_arm_l_joint4 |
| 4 | idx25_arm_l_joint5 |
| 5 | idx26_arm_l_joint6 |
| 6 | idx27_arm_l_joint7 |
| 7 | idx61_arm_r_joint1 |
| 8 | idx62_arm_r_joint2 |
| 9 | idx63_arm_r_joint3 |
| 10 | idx64_arm_r_joint4 |
| 11 | idx65_arm_r_joint5 |
| 12 | idx66_arm_r_joint6 |
| 13 | idx67_arm_r_joint7 |
| 14 | idx32_gripper_l_outer_joint1 |
| 15 | idx72_gripper_r_outer_joint1 |
| 16 | idx01_body_joint1 |
| 17 | idx02_body_joint2 |
| 18 | idx03_body_joint3 |
| 19 | idx04_body_joint4 |
| 20 | idx05_body_joint5 |
维度分组:
0:14:G2 左右双臂 14 个关节,左臂 7 维后接右臂 7 维。14:16:90D 左右夹爪 2 维。16:21:G2 腰部/躯干 5 维,运行时对应idx01_body_joint1到idx05_body_joint5。
推理说明
容器内可将目标 checkpoint 挂载到 runtime 默认目录:
/home/syf/popcorn_pi05_best_9000
策略服务 prompt 建议固定为:
Sort Packages
注意事项
- 面向
G2_90d新夹爪布局;不要按旧idx41/idx81夹爪接口使用。 - 当前布局下不需要旧 motion mapper。
step56000是当前最佳整体候选,但 E2E 仍为 0/32,需要继续前台复现和定位。