逆强化学习:从专家行为中反推出潜在奖励函数,再据此学习策略的模仿学习方法。