AlphaZero:DeepMind 提出的自博弈强化学习系统,结合神经网络评估与 MCTS 学习棋类策略。