移动机器人安全控制与强化学习(1)安全控制

type

status

date

slug

summary

安全机器人的行为案例

移动机器人

工业机器人

传统工业机器人中会设置安全区，在机械臂的工作空间内一般是禁止人员进入的。

但是如果工业机器人可以有一个良好的安全控制，那么工业机器人就可以实现人机协同、以及服务机器人的相关工业实现。

课程相关环境

Robot_Safe_Navigation

hychen-naza • Updated Dec 29, 2023

课程的相关代码在上面的github链接中

红色为机器人，灰色为避障环境。

代码主要依赖两个库cvxopt与tensorflow，其中cvxopt是一个凸优化求解包，一般在轨迹规划问题中，将当前环境障碍物信息与机器人的状态等信息建模为凸优化问题，使用这个包可以求解出机器人的最佳路径。

PS：一点题外话，这个包同样可以用在关节机器人的运动控制问题、整合传感器信息的自身姿态估计问题等。

第二个包就是tensorflow包，这个就不多说了。

安全控制

代码中的main.py与ssa.py两个代码是安全控制的主要部分

安全集(safe set)

一种定义安全集的方法,即当前机器人机械臂上所有点都和人上的所有点大于一个距离γ.

由安全集指定安全策略

潜在域方法

峰值代表障碍物,机器人通过对峰值之间力进行合成,得到一个最终的安全行进路线.

感觉是人工势场法

朴素策略的一些问题

存在这种控制存在一定延迟的情况下,或者环境相对较为复杂.如果仅仅的增加安全距离,整个系统的策略会过于保守.丢失一部分最优解.

结论

安全评价指标

安全指数的设计方法

安全指数的响应策略

似乎是构建起了一个李雅普诺夫函数,通过李氏函数的收敛性条件来保证函数的安全性.

安全指数到安全策略的转换

对于二维平面移动问题而言,机器人的状态为p_x,p_y.构建一个李氏控制系统.

上述的推导可见

对于控制信号U,希望得到U的最小方向.那么对于U就是求两个李代数的模值.

循环控制中的安全策略

黑色的是最安全的控制信号

红色的是初始的控制信号

初始的控制信号有可能是不安全的,要在上一个控制信号和最安全的控制信号中生成一个相对最安全的控制信号.就是