首页
Python
Java
PHP
IOS
Andorid
NodeJS
JavaScript
HTML5
强化学习
Flink + 强化学习 搭建实时推荐系统
如今的推荐系统,对于实时性的要求越来越高,实时推荐的流程大致可以概括为这样: 推荐系统对于用户的请求产生推荐, […]
matplotlib 强化学习
matplotlib 强化学习 import matplotlib.pyplot as plt ... Reward […]
论文阅读: A Review of Robot Learning for Manipulation: Challenges, Representations, and Algorithms
机器人学习操纵综述:挑战,表示形式和算法 1.介绍 因此,研究人员专注于机器人应如何学习操纵周围世界的问题。 […]
[强化学习]Part1:强化学习初印象
引入 智能 人工智能 强化学习初印象 强化学习的相关资料 经典书籍推荐:《Reinforcem […]
强化学习 – 机器人走迷宫
强化学习 – 机器人走迷宫 通过这篇文章,分享基于Udacity的机器人走迷宫项目,使用强化学习实 […]
强化学习(十七) 基于模型的强化学习与Dyna算法框架
在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Polic […]
强化学习(十五) A3C
在强化学习(十四) Actor-Critic中,我们讨论了Actor-Critic的算法流程,但是由于 […]
强化学习(十四) Actor-Critic
在强化学习(十三) 策略梯度(Policy Gradient)中,我们讲到了基于策略(Policy B […]
在 Windows 10 中使用 OpenAI Spinning Up
前段时间,openAI 发布了 Spinning Up ,本篇博客将介绍如何在 Windows 系统中使用 S […]
强化学习(1)–简介
一.简介 机器学习现在主流上被分为三种,分别是: 监督学习,如神经网络 无监督学习,如k-means 强化学习 […]
强化学习(十二) Dueling DQN
在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权 […]
强化学习(十一) Prioritized Replay DQN
在强化学习(十)Double DQN (DDQN)中,我们讲到了DDQN使用两个Q网络,用当前Q网络计 […]
强化学习(十)Double DQN (DDQN)
在强化学习(九)Deep Q-Learning进阶之Nature DQN中,我们讨论了Nature D […]
强化学习(九)与Deep Q-Learning进阶之Nature DQN
在强化学习(八)价值函数的近似表示与Deep Q-Learning中,我们讲到了Deep Q-Lear […]
强化学习(八)价值函数的近似表示与Deep Q-Learning
在强化学习系列的前七篇里,我们主要讨论的都是规模比较小的强化学习问题求解算法。今天开始我们步入深度强化 […]
【强化学习】MOVE37-Introduction(导论)
写在前面的话:从今日起,我会边跟着硅谷大牛Siraj的MOVE 37系列课程学习Reinforcement L […]
强化学习(四)用蒙特卡罗法(MC)求解
在强化学习(三)用动态规划(DP)求解中,我们讨论了用动态规划来求解强化学习预测问题和控制问题的方法。 […]
强化学习之Sarsa (时间差分学习)
上篇文章讲到Q-learning, Sarsa与Q-learning的在决策上是完全相同的,不同之处在于学 […]
强化学习之Q-learning ^_^
许久没有更新重新拾起,献于小白 这次介绍的是强化学习 Q-learning,Q-learning也是离线 […]
热门专题
Linux学习笔记(七)——初识bash
【程序员笑话】让你泪流满面的瞬间
developer角度回顾Apple历届发布会(一)
手写数字图片识别-卷积神经网络
【Python多进程实现】
【看完就懂】Laravel
Zeal——好用的离线
苹果IOS
区块链技术公司谈并不是所有手机都叫区块链手机
就能快速查密码
Java编程思想重点笔记
sql语句练习
村五级
如何在Windows中完成.patch补丁~
使用多个数据源
卷积神经网络cnn的实现
cheng带来啦~
解决开机后小键盘灯不亮
Jetpack系列:应用内导航的正确使用方法
软件设计模式
阴影映射
接入层
1
2
3
4
5
…
10
Next »