LazyBearLee's Blog

Home

❯

Note

❯

强化学习

文件夹: Note/强化学习

此文件夹下有9条笔记。

  • 2025年10月17日

    BIT2025强化学习笔记(一)强化学习的环境与马尔可夫过程

    • 强化学习
  • 2025年10月17日

    BIT2025强化学习笔记(二)马尔可夫决策过程 (MDP) 的形式化

    • 强化学习
  • 2025年10月11日

    值迭代的收敛性

    • 强化学习
  • 2025年10月11日

    压缩映射定理

    • 强化学习
  • 2025年10月11日

    策略改进

    • 标签
  • 2025年10月11日

    诺伊曼级数 (Neumann Series)以及它在强化学习中关于值函数性质

    • 强化学习
  • 2025年10月11日

    贝尔曼方程矩阵形式与求解

    • 标签
  • 2025年10月10日

    关于状态值

    • 强化学习
    • 状态值
  • 2025年10月10日

    贝尔曼方程推导

    • 强化学习

Created with Quartz v4.5.1 © 2025

  • GitHub
  • Discord Community