行为克隆:从专家示范中监督学习策略的模仿学习方法,把状态到动作的映射当作标注数据学习。