TensorFlow强化学习快速入门指南.使用Python动手搭建自学习的智能体

本书首先介绍了强化学习的基本原理, 然后介绍典型的强化学习算法, 包括时序差分、SARSA、Q-Learning、DeepQ-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等, 每种算法基本上利用了主流的开源机器学习框架TensorFlow, 使用Python编程进行实现。此外, 还介绍了一些上述算法的应用。本书可以使读者快速理解强化学习的基本知识, 并通过简单的案例加深对算法的理解。