第六编 强化学习与决策智能 · 06_第六编_强化学习与决策智能/第24章_强化学习的数学框架/chapter.md 第24章 强化学习的数学框架 本章将讨论强化学习如何把决策、状态转移与长期回报写成统一数学框架。 上一章第六编 强化学习与决策智能第六编 强化学习与决策智能下一章第25章 从经典强化学习到深度强化学习第六编 强化学习与决策智能