SurprisedCat
主页
专栏 icon
学习笔记 工程笔记
资料库 icon
资料Web版 资料库链接
分类
归档
关于
  • 强化学习之价值函数近似与DQN

    May 10, 2021 · 强化学习  ·
    分享到:
    强化学习之价值函数近似与DQN

    强化学习中的查表法只适用于规模较小的问题。生活中有许多实际问题要复杂得多,有些是属于状态数量巨大甚至是连续的,有些行为数量较大或者是连续的。因此需要用价值函数近似求解那些状态数量多或者是连续状态的强化学习问题。

    更多
  • 强化学习之DP,MC,TD

    May 9, 2021 · 强化学习  ·
    分享到:
    强化学习之DP,MC,TD

    其实可以把MC、TD都理解成DP的一种近似,只不过降低了计算复杂度以及削弱了对环境模型完备性的假设。动态规划的使用条件:……

    更多
  • 强化学习-基础

    Oct 12, 2019 · 强化学习  ·
    分享到:
    强化学习-基础

    Valued-based / policy-based / A3C=A+C;Model based / Model free;回合更新(蒙特卡洛) / 时间差分(步更新);On-policy / off-policy;稳态和非稳态;全部可观测MDP / 部分可观测

    更多
  • 强化学习-多臂老虎机问题

    Oct 12, 2019 · 强化学习  ·
    分享到:
    强化学习-多臂老虎机问题

    tochastic MAB(stationary random rewards MAB);non-stochastic MAB(Adversarial Bandits) 对抗性质,有对手会改变每个臂的收益,根据对手是否与玩家独立可分为oblivious和non-oblivious两种

    更多
  • 强化学习-概要

    Oct 12, 2019 · 强化学习  ·
    分享到:
    强化学习-概要

    explore and exploit;Delayed reward;Time critical(时间处理实现);Agent actor稳定提升

    更多
SurprisedCat photo

SurprisedCat

朝花夕拾,人类从历史中学到的唯一教训,就是人类无法从历史中学到任何教训。

分类

概率统计随机过程 27 优化理论 21 线性代数与矩阵 18 数学分析 14 机器学习 13 PYTHON 12 测度论 12 LINUX 11 SHELL 9 实变函数 8
所有分类
A1 AI1 BUGS1 CPLUS3 DEVOPS1 ECMASCRIPT5 JEKYLL2 LINUX11 MATLAB4 PYTHON12 RASPBERRY7 SHELL9 WINDOWS1 优化理论21 博弈论3 变分法4 图像处理1 大数据2 实变函数8 强化学习5 拓扑学3 数值计算3 数学3 数学分析14 数据库1 无线通信2 机器学习13 概率统计随机过程27 正则表达式1 测度论12 深度学习2 离散数学1 算法3 算法理论5 线性代数与矩阵18 组合数学2
字母数量

精选文章

  • hadoop-HDFS集群部署
  • hadoop-搭建Hadoop虚拟机环境
  • javascript-Chrome扩展实例(三)
  • javascript-Chrome扩展实例(二)
  • javascript-Chrome扩展实例(一)

最新文章

  • hadoop-HDFS集群部署
  • hadoop-搭建Hadoop虚拟机环境
  • AI-神经网络玩雅达利游戏(atari 2600)的预处理

标签

概率统计随机过程 27 优化理论 21 线性代数与矩阵 18 数学分析 14 PYTHON 13 机器学习 13 测度论 12 LINUX 11 SHELL 9 实变函数 8
所有标签
A1 AI1 BUGS1 CLI处理流程6 CPLUS4 DEVOPS1 DOCKER2 ECMASCRIPT5 HADOOP2 IDE2 JAVASCRIPT5 JEKYLL2 LINUX11 LINUX文本处理1 MATLAB4 PYTHON13 PYTORCH1 RASPBERRY7 SHELL9 TENSORFLOW4 WINDOWS1 优化理论21 博弈论3 变分法4 图像处理1 复变函数1 大数据2 安全1 实变函数8 强化学习5 拓扑学3 数值计算3 数学3 数学分析14 数据库1 数理统计1 无线通信2 机器学习13 概率统计随机过程27 正则表达式1 测度论12 深度学习2 离散数学1 算法5 算法理论5 线性代数与矩阵18 组合数学2 统计学3 读书笔记2 贝叶斯统计2
字母数量
SurprisedCat

Copyright 2020-  SURPRISEDCAT. All Rights Reserved