强化学习

Flink + 强化学习搭建实时推荐系统

如今的推荐系统，对于实时性的要求越来越高，实时推荐的流程大致可以概括为这样：推荐系统对于用户的请求产生推荐， […]

matplotlib 强化学习

matplotlib 强化学习 import matplotlib.pyplot as plt ...![]( […]

什么是强化学习？

摘要：本文尝试以一种通俗易懂的形式对强化学习进行说明，将不会包含一个公式。本文分享自华为云社区《强化学习浅述 […]

推荐系统论文之序列推荐：KERL

KERL: A Knowledge-Guided Reinforcement Learning Modelfo […]

MindSpore：基于本地差分隐私的 Bandit 算法

摘要：本文将先简单介绍Bandit 问题和本地差分隐私的相关背景，然后介绍基于本地差分隐私的 Bandit 算 […]

强化学习五大方面-奖励与策略结构

目录前言奖励策略探索与利用纯探索纯利用利用与探索的平衡奖励与价值策略表达方式基于表格基于 […]

强化学习五大方面-环境

目录前言环境的概述环境分类物理环境仿真环境导航前言接下来会对环境进行阐述，该文章内容和较少 […]

强化学习-简介

目录背景监督式学习非监督式学习强化学习强化学习五个方面 Environment（环境） Reward […]

论文阅读： A Review of Robot Learning for Manipulation: Challenges, Representations, and Algorithms

机器人学习操纵综述：挑战，表示形式和算法 1.介绍因此，研究人员专注于机器人应如何学习操纵周围世界的问题。 […]

[强化学习]Part1：强化学习初印象

引入智能人工智能强化学习初印象强化学习的相关资料经典书籍推荐：《Reinforcem […]

强化学习 – 机器人走迷宫

强化学习 – 机器人走迷宫通过这篇文章，分享基于Udacity的机器人走迷宫项目，使用强化学习实 […]

强化学习(十七) 基于模型的强化学习与Dyna算法框架

　　　　在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Polic […]

强化学习(十五) A3C

　　　　在强化学习(十四) Actor-Critic中，我们讨论了Actor-Critic的算法流程，但是由于 […]

强化学习(十四) Actor-Critic

　　　　在强化学习(十三) 策略梯度(Policy Gradient)中，我们讲到了基于策略(Policy B […]

在 Windows 10 中使用 OpenAI Spinning Up

前段时间，openAI 发布了 Spinning Up ,本篇博客将介绍如何在 Windows 系统中使用 S […]

强化学习(1)–简介

一.简介机器学习现在主流上被分为三种，分别是：监督学习，如神经网络无监督学习，如k-means 强化学习 […]

强化学习(十二) Dueling DQN

　　　　在强化学习(十一) Prioritized Replay DQN中，我们讨论了对DQN的经验回放池按权 […]

强化学习(十一) Prioritized Replay DQN

　　　　在强化学习（十）Double DQN (DDQN)中，我们讲到了DDQN使用两个Q网络，用当前Q网络计 […]

强化学习（十）Double DQN (DDQN)

　　　　在强化学习（九）Deep Q-Learning进阶之Nature DQN中，我们讨论了Nature D […]

强化学习（九）与Deep Q-Learning进阶之Nature DQN

　　　　在强化学习（八）价值函数的近似表示与Deep Q-Learning中，我们讲到了Deep Q-Lear […]

强化学习（八）价值函数的近似表示与Deep Q-Learning

　　　　在强化学习系列的前七篇里，我们主要讨论的都是规模比较小的强化学习问题求解算法。今天开始我们步入深度强化 […]

【强化学习】MOVE37-Introduction（导论）

写在前面的话：从今日起，我会边跟着硅谷大牛Siraj的MOVE 37系列课程学习Reinforcement L […]

强化学习（四）用蒙特卡罗法（MC）求解

　　　　在强化学习（三）用动态规划（DP）求解中，我们讨论了用动态规划来求解强化学习预测问题和控制问题的方法。 […]

强化学习之Sarsa （时间差分学习）

上篇文章讲到Q-learning, Sarsa与Q-learning的在决策上是完全相同的，不同之处在于学 […]

强化学习之Q-learning ^_^

许久没有更新重新拾起，献于小白这次介绍的是强化学习　　Q-learning，Q-learning也是离线 […]

强化学习

热门专题