观察桌面
→ 识别目标
→ 计算三维位置
→ 转换到机械臂坐标系
→ 生成抓取动作
→ 控制夹爪
→ 放置并撤离

桌面上有没有笔
哪一个物体是笔
笔离手有多远
笔是横着、竖着还是斜着
手应该从哪个方向靠近
什么时候张开手指
什么时候夹住
夹住后放到哪里

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

YOLOE 检测框 / mask
+ 深度图
+ 相机内参
→ 相机坐标系下的目标点

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

object_point_camera
→ TF: arm_Camera 到 base_link_arm
→ object_point_base

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

目标点
→ 预抓取点
→ 抓取点
→ 抬起点
→ 放置点
→ 关节轨迹

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

到达预抓取点
→ 打开夹爪
→ 接近抓取点
→ 闭合夹爪
→ 抬起目标
→ 到达放置点
→ 打开夹爪

    cd ~/robotac_isaac_assets
    ./integrated_runtime/run_demo_scene.sh --world bobac_observation

1. 到观察位姿
2. 等待图像稳定
3. 识别目标
4. 计算目标三维位置
5. 转换到 base_link_arm
6. 生成预抓取点和抓取点
7. 规划到预抓取点
8. 打开夹爪
9. 规划到抓取点
10. 闭合夹爪
11. 抬起目标
12. 移动到放置点
13. 打开夹爪
14. 退回安全位置

相机看见目标
→ YOLOE 找到目标
→ 深度图算出三维点
→ TF 转到机械臂坐标系
→ 规划机械臂靠近方式
→ 夹爪完成抓取和释放

阶段	要解决的问题	输出结果
观察	相机是否看到桌面目标	RGB 图像、深度图
识别	图像中哪一块是目标物体	类别、检测框、mask
定位	目标相对相机在哪里	相机坐标系下的三维点
方向估计	目标怎么摆放	目标长轴方向
坐标转换	目标在机械臂坐标系下在哪里	`base_link_arm` 下的目标点和方向
运动规划	机械臂怎样靠近目标	预抓取点、抓取点、抬起点
夹爪控制	什么时候打开和闭合	夹爪关节命令
流程编排	各动作按什么顺序执行	完整抓取放置状态流程

环境	作用
Isaac Sim 容器/终端	启动仿真场景，加载 Bobac、桌面、相机、深度图、TF 和关节控制接口
ROS 容器/终端	运行 ROS2 节点，处理图像、深度、TF、规划和夹爪控制

图像内容	识别结果	后续用途
桌面上的目标物体	目标类别	判断是否找到了需要抓取的物体
目标在图像中的位置	检测框	确定目标大致中心区域
目标的轮廓区域	mask	辅助计算目标方向和深度位置

观察项	正常现象
`/demo_grasp/commanded_pose`	输出候选末端位姿
`/hand_command`	输出机械臂关节命令
Isaac Sim 画面	机械臂产生可见动作

能力	说明
预抓取点生成	先到目标上方或侧前方安全位置，避免直接撞向桌面
抓取姿态生成	根据 `normal`、`long_axis` 和夹爪结构确定末端姿态
逆运动学	求出能到达目标姿态的关节角
轨迹规划	生成平滑、满足关节限制的运动路径
碰撞检查	避免碰到桌面、目标物和机器人自身
执行判断	规划失败或执行失败时停止、重试或换策略

第五章：抓取放置功能实现¶

5.1 抓取放置任务拆解¶

5.1.1 机器人抓笔需要哪些判断¶

5.1.2 本章运行环境¶

5.1.3 编译示例程序¶

5.2 阶段一：让相机看到目标¶

5.2.1 为什么先检查相机¶

5.2.3 查看相机画面¶

5.3 阶段二：识别图像中的目标¶

5.3.0 什么是视觉识别模型？¶

5.3.1 为什么使用 YOLOE¶

5.3.2 启动识别¶

5.3.3 识别结果怎么看¶

5.3.4 如果没有识别结果¶

5.4 阶段三：从图像区域估计三维位置¶

5.4.1 识别结果为什么不能直接用于抓取¶

5.4.2 深度图提供什么信息¶

5.4.3 从像素反投影到相机坐标系¶

5.4.4 为什么还要估计目标方向¶

5.4.5 启动深度定位¶

5.5 阶段四：转换到机械臂坐标系¶

5.5.1 为什么需要坐标转换¶

5.5.2 启动坐标转换¶

5.6 阶段五：从目标位置到机械臂动作¶

5.6.1 运动规划要解决什么¶

5.6.2 基础动作验证¶

5.6.3 参赛者需要实现什么¶

5.7 阶段六：控制夹爪¶

5.7.1 夹爪在流程中的作用¶

5.7.2 启动夹爪测试¶

5.8 阶段七：完整流程设计¶

5.8.1 完整抓取放置应该怎样组织¶

5.8.2 实现路线建议¶

5.9 本章小结¶

阶段	成功条件	失败处理
识别	检测到目标且置信度足够	重新观察或调整阈值
深度定位	得到有效三维点	重新取深度或重新识别
TF 转换	得到 `base_link_arm` 下目标点	检查 TF 树和时间戳
规划	得到可执行轨迹	调整预抓取点或重新规划
夹取	夹爪闭合后目标未掉落	调整抓取点和夹爪闭合位置
放置	目标落到指定区域	调整放置高度和撤离方向

方案	适合情况	注意事项
MoveIt 规划	希望使用成熟 IK、轨迹规划和碰撞检测	需要配置好模型、规划组和控制器
自行实现 IK	机械臂结构清楚、任务区域固定	要处理关节限制和奇异位形
示教点加插值	快速验证固定区域动作	泛化能力弱，目标变化大时容易失败