RDA: AnAccelerated Collision Free Motion Planner for Autonomous Navigation in Cluttered Environments

GitHub TRO Arxiv YouTube Bilibili ROS

此论文以OBCA为基础，具体解释请参考OBCA

3. 问题陈述

3.1 障碍物模型

障碍物可以看成凸机，用锥不等式表示

$\mathbb{O}_m = \left\{ \bm{o} \in \mathbb{R} ^{O_m} \mid \bm{D}_m \bm{o} \preceq_{\mathcal{O}_m} \bm{b}_m \right\}$

其中 $m$ 代表障碍物的序号

3.2 机器人模型

可以将机器人本体看成一个紧凑的凸集，初始状态用锥不等式表示，对初始状态进行旋转和平移便可以得到不同时刻的占用空间表示

$\begin{gather*} \mathbb{C} = \left\{ \bm{z} \in \mathbb{R} ^{n_r} \mid \bm{Gz} \preceq_{\mathcal{K}_r}\bm{h} \right\} \\ \mathbb{Z}_t(\bm{s}_t) = \left\{ \bm{R}_t(\bm{s}_t)\bm{z} + \bm{p}(\bm{s}_t) \mid \bm{z} \in \mathbb{C} \right\} \end{gather*}$

其中 $n_r$ 表示机器人工作空间的维度

3.3 避碰

机器人和障碍物的最小距离表示为

$\operatorname{dist} (\mathbb{Z}_t(\bm{s}_t),\mathbb{O}) = \min \left\{ \lVert \bm{e} \rVert_2 \mid (\mathbb{Z}_t(\bm{s}_t) + \bm{e}) \cap \mathbb{O} \neq \emptyset \right\}$

结合机器人模型和障碍物模型，可以得到

$\begin{align*} \operatorname{dist} (\mathbb{Z}_t(\bm{s}_t),\mathbb{O}) = \min _{\bm{z},\bm{o}} \ & \lVert \bm{R}(\bm{s}_t)\bm{z}+\bm{p}(\bm{s}_t) - \bm{o} \rVert_2 \\ \text{s.t.} \ & \bm{Do} \preceq _{\mathcal{O}_m} \bm{b}, \\ & \bm{Gz} \preceq _{\mathcal{K}_r} \bm{h} \end{align*}$

3.4 问题表述

MPC的目标是在满足约束的情况下最小化凸且光滑的成本函数。路径跟踪的目标是让机器人尽量以期望速度沿着期望轨迹运动

$C_0(\left\{ \bm{s}_t , \bm{u}_t \right\} )= \sum_{h=0}^{N} (\lVert \bm{Q} \circ (\bm{s}_{t}-\bm{s}_{t}^\diamondsuit) \rVert_2^2 + \lVert \bm{P} \circ (\bm{v}_{t}-\bm{v}_{t}^\diamondsuit) \rVert_2^2)$

其中 $\left\{ \bm{Q},\bm{P} \right\}$ 是权重系数，分别影响机器人尽量沿期望轨迹和尽量保持期望速度

MPC优化问题可以表述为

$\begin{align*} P_0 : \min _{ \left\{ \bm{s}_t , \bm{u}_t \right\} } \ &C_0(\left\{ \bm{s}_t , \bm{u}_t \right\}) \\ \text{s.t.} \ & \bm{s}_{t+1} = \bm{A}_t \bm{s}_t + \bm{B}_t \bm{u}_t + \bm{c}_t, \\ & \bm{u}_{\min} \preceq \bm{u}_t \preceq \bm{u}_{\max}, \\ & \bm{a}_{\min} \preceq \bm{u}_{t+1}-\bm{u}_t \preceq \bm{a}_{\max}, \\ &\operatorname{dist} (\mathbb{Z}_t(\bm{s}_t),\mathbb{O}_m) \geq d_{\text{safe}} \end{align*}$

3.5 目前的挑战

最后一项距离约束是碰撞避免的充分条件，但不是必要条件，因此在实现过程中很容易出现无解的情况
障碍物数量可能很大，那么计算量会很大

4. RDA无碰撞运动规划器

4.1 $l_1$ 正则化

为了解决第一个挑战，将 $d_{\text{safe}}$ 被替换为向量变量 $d =[d_1,\cdots,d_N]^\top \in \mathbb{R} ^N$ 。每个 $d_t$ 由 $d_{\max}$ 上界和 $d_{\min}$ 下界限制。此外还需要修改优化的目标函数，否则可能会导致所有 $d_t$ 全取为下界以满足约束。因此，在目标函数上增加了 $l_1$ 正则化，即 $C_1(\bm{d}) = - \eta \lVert \bm{d} \rVert_1 = -\eta \sum_{t=0}^{N}d_t$ ，其中 $\eta$ 为正的权重系数。这样便可以在满足无碰撞约束的前提下尽可能增大 $d_t$

$l_1$ 的限定区域是包含凸点的即四个顶点，最优解更容易落在凸点上，此时部分分量最小，部分分量最大，所以最终的 $\bm{d}$ 更加容易变得稀疏。因为MPC在远时刻处预测的误差较大，因此更容易触发碰撞，为了满足约束很可能会导致 $d_t$ 较低。所以最终的结果很可能：近时刻生成较大的 $d_t$ ，而在远时刻生成较小的 $d_t$ 。注意这只是倾向性结果，并非必然结果，有可能障碍物很少， $d_t$ 全取为最大值

4.2 通过交替方向乘子法实现并行计算

令 $\bm{y}=\bm{Rz}+\bm{p} - \bm{o}$ ，无碰撞约束的拉格朗日对偶问题可以写为

$\begin{align*} & \max _{\bm{\lambda }, \bm{\mu },\bm{\xi}} \min _{\bm{y},\bm{o},\bm{z}} \ \lVert \bm{y} \rVert_2 + \bm{\lambda }^\top (\bm{Do}-\bm{b})+ \bm{\mu }^\top (\bm{Gz}-\bm{h}) + \bm{ \xi}^\top (\bm{Rz}+\bm{p} - \bm{o} - \bm{y})\\ = & \max _{\bm{\lambda }, \bm{\mu },\bm{\xi}} \ \min _{\bm{y}} \ (\lVert \bm{y} \rVert - \bm{\xi }^\top \bm{y}) + \min _{\bm{o}} \ (\bm{\lambda }^\top \bm{Do} - \bm{\xi }^\top \bm{o}) + \min _{\bm{z}} \ (\bm{\mu }^\top \bm{Gz} - \bm{\xi}^\top \bm{Rz}) -\bm{\lambda }^\top \bm{b} - \bm{\mu}^\top \bm{h} + \bm{\xi}^\top \bm{p} \end{align*}$

为了保证内层的极小化结果是有限的，需要令 $\lVert \bm{\xi}\rVert_* \leq 1$ ， $\bm{\xi}-\bm{D}^\top \bm{\lambda } = 0$ ， $\bm{G}^\top \bm{\mu} - \bm{R}^\top \bm{\xi} = 0$ ，因此可以将 $\bm{\xi}=\bm{D}^\top \bm{\lambda }$ 代入原式

因为 $\mathbb{O}$ 和 $\mathbb{C}$ 具有非空相对内部，具有强对偶性。因此原问题与对偶问题等价

$\begin{align*} \operatorname{dist} (\mathbb{Z}_t(\bm{s}_t),\mathbb{O}_m) = \max _{\bm{\lambda }_{t,m},\bm{\mu}_{t,m}} \ & \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{p}_t(\bm{s}_t) - \bm{\lambda}_{t,m}^\top \bm{b}_m - \bm{\mu}_{t,m}^\top \bm{h}_m \\ \text{s.t.} \ & \lVert \bm{D}_m^\top \bm{\lambda}_{t,m} \rVert_* \leq 1, \\ & \bm{\mu}_{t,m}^\top \bm{G} + \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{R}_t(\bm{s}_t)= 0, \\ & \bm{\lambda}_{t,m} \succeq _{\mathcal{O}^*_m} 0, \\ & \bm{\mu}_{t,m} \succeq _{\mathcal{K}_r^*} 0 \end{align*}$

其中 $t$ 代表时刻， $m$ 代表障碍物的序号。因此

$\begin{align*} &\operatorname{dist} (\mathbb{Z}_t(\bm{s}_t),\mathbb{O}_m) \geq d_t \Leftrightarrow\\ &\exists \bm{\mu}_{t,m} \succeq _{\mathcal{K}_r^*} 0 , \bm{\lambda}_{t,m} \succeq _{\mathcal{O}^*_m} 0 : \\ & \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{p}_t(\bm{s}_t) - \bm{\lambda}_{t,m}^\top \bm{b}_m - \bm{\mu}_{t,m}^\top \bm{h}_m \geq d_t , \\ &\lVert \bm{D}_m^\top \bm{\lambda}_{t,m} \rVert_* \leq 1 , \quad \bm{\mu}_{t,m}^\top \bm{G} + \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{R}_t(\bm{s}_t)= 0 \end{align*}$

具备避障功能的模型预测控制可以改写为

$\begin{align*} \min_{\substack{\left\{ \bm{s}_t , \bm{u}_t , d_t \right\} \\ \left\{ \bm{\lambda}_{t,m} , \bm{\mu}_{t,m} , z_{t,m} \right\}} } \ & C_0(\left\{ \bm{s}_t , \bm{u}_t \right\}) + C_1(\bm{d}) \\ \text{s.t.} \ & \bm{s}_{t+1} = \bm{A}_t \bm{s}_t + \bm{B}_t \bm{u}_t + \bm{c}_t, \\ & \bm{u}_{\min} \preceq \bm{u}_t \preceq \bm{u}_{\max}, \quad \bm{a}_{\min} \preceq \bm{a}_t \preceq \bm{a}_{\max}, \\ & d_t \in [d_{\min }, d_{\max}], \quad z_{t,m} \geq 0, \\ & \lVert \bm{D}_m^\top \bm{\lambda}_{t,m} \rVert_* \leq 1, \\ & \bm{\lambda}_{t,m} \succeq _{\mathcal{O}^*_m} 0, \quad \bm{\mu}_{t,m} \succeq _{\mathcal{K}_r^*} 0,\\ & H_{t,m}(\bm{s}_t,\lambda_{t,m},\mu_{t,m}) = 0, \\ & I_{t,m}(\bm{s}_t,\lambda_{t,m},\mu_{t,m},d_t,z_{t,m}) = 0 \end{align*}$

其中

$\begin{gather*} H_{t,m}(\bm{s}_t,\lambda_{t,m},\mu_{t,m}) = \bm{\mu}_{t,m}^\top \bm{G} + \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{R}_t(\bm{s}_t) \\ I_{t,m}(\bm{s}_t,\lambda_{t,m},\mu_{t,m},d_t,z_{t,m}) = \bm{\lambda}_{t,m}^\top \bm{D}_m \bm{p}_t(\bm{s}_t) - \bm{\lambda}_{t,m}^\top \bm{b}_m - \bm{\mu}_{t,m}^\top \bm{h}_m - d_t - z_{t,m} \end{gather*}$

为了将距离的不等式转换为等式，新加入了变量 $z_{t,m}$ ，即 $\dots \geq d_t \Leftrightarrow \exists z_{t,m} \geq 0 : \dots - d_t - z_{t,m}=0$