总体思路
论文总体思路利用求解拉格朗日方程,将约束问题转换为无约束问题,并通过构建的kkt条件借助对最优解的导数来隐式的求解所涉及的loss对参数(C,c,F,f)的导数,这其中渗透参杂这许多引理,如果只是使用可以不求甚解,更多细节需要仔细推敲
算法流程
# **1. 算法流程(Algorithm 2简化版)**
• **输入**:初始状态$x_{\text{init}}$,初始控制序列$u_{\text{init}}$,参数$\theta$。
• **前向传播**:
1. 使用iLQR求解MPC,得到$\tau^*$。
2. 记录最后一次迭代的$H^n$(成本Hessian)和$F^n$(动力学Jacobian)。
• **反向传播**:
1. **构造零约束LQR问题**:
◦ 成本函数:$\sum_t \frac{1}{2} d_{\tau_t}^\top H^n d_{\tau_t} + (\nabla_{\tau_t^*}\ell)^\top d_{\tau_t}$。
◦ 约束:$d_{x_1}=0$,$d_{x_{t+1}}=F^n d_{\tau_t}$,$d_{u_{t,i}}=0$(若$u_{t,i}^*$在边界)。
2. **求解得到$d_\tau^*$**:复用前向传播的矩阵分解,高效计算。
3. **计算梯度**:利用公式8和链式法则更新$\theta$。
Comments NOTHING