课程-5. 客如何学习AlphaGo的赢家策略

SmartADT 2021-08-31 原文


课程-5. 客如何学习AlphaGo的赢家策略

 [返回首頁]

AI时代,创客如何向AlphaGo学习出人头地

课程(2天)

 

主讲人:高焕堂

课程目标:

   AI机器人AlphaGo打败天下无敌手,已经出人头地了,创客们何不向AlphaGo学习呢? 于是,我写出了《AI时代创客葵花宝典:向AlphaGo学习出人头地》。此课程就是来替您讲解《AI时代创客葵花宝典》。 因为AlphaGo懂得如何征服自己面对的巨大不确定性棋局,因而超越了人类顶尖高手。学习AlphaGo如何探索机会之后,创客就懂得面对AI的不确定市场。企业就像AlphaGo一样,超越了顶尖的人类竞争对手,出人头地了。

   传统上,人类的学习偏重于<利用>所学的知识,去发挥所长,解决问题(problem)。如果人类(如创客)能从AI强化学习得到启示,强化探索能力,则人人能探索更多可能(possibility),得到更多机会(opportunity)。 在高度不确性的环境里,唯有懂得降低风险,才敢大胆探索、提高胜率。一旦您选择了创客/创业之路,若能向它学会探索机会的方法,将会协助您在创业路途上,心想事成,鸿图大展。

 

课程大纲:

Day-01

内容

主题:

探索大机会:向AlphaGo学习

  1. 创客进入一个不确定性很高的商场
  2. AlphaGo懂得征服自己面对的巨大不确定性棋局
  3. 与不确定共舞(Living with Uncertainty)
  4. 力求降低风险,才敢大胆探索,成为赢家

主题:

创客(企业)的甜区在那里?

  1. 利用(exploitation):做当前所知能产生最大回报的事情
  2. 探索(exploration):尝试以前从未做过的事情,以求获得更高的报酬
  3. 强化(Reinforcement)学习:让AlphaGo在探索和利用之间找到平衡,得到全局最佳解(global optima)。
  4. 人类常常受限于现有知识,只能得区域最佳解(local optima)而失败

主题:

不确定性(Uncertainty)环境的赢家策略

  1. 降低风险:领悟战场上,要<不打没把握的仗>
  2. 降低风险:领悟股市上,要如巴菲特所说<不赔钱>。
  3. 力求降低风险,才敢大胆探索:从AI强化学习得到启示,强化探索能力,则人人能探索更多可能(possibility),得到更多机会(opportunity)
  4. AlphaGo的降低风险策略:蒙地卡罗搜寻(MCTS) + 剪枝策略

<分组讨论>主题:

学以致用:练习探索自己的甜区和商机

  1. 寻找自己创领域的甜区
  2. 练习剪枝:即删除<没把握的仗>
  3. 继续探索没被删除的选项

 

 

Day-02

内容

主题:

创新:正偏相倚、黄金胜律

  1. 正偏相倚:田忌赛马的范例
  2. AlphaGo的<正偏相倚>:AlphaGo 倾向于提高胜算而放弃更多赢子数,来降低不能取胜的风险,即使是很小的差距仍会纳入考虑
  3. 不求最优:从局末优势确定下,AlphaGo选择了略微吃亏,但较有把握的方法。
  4. 正偏相倚,黄金胜律:<不寻求最优、不平行并列、不均衡对称、不面面俱到、不四平八稳>

主题:

减法设计:MCTS+剪枝(Pruning)

  1. AlphaGo擅用<去芜存菁>策略,来缩小探索<空间>,提高探索绩效
  2. 蒙地卡罗搜寻(MCTS)给出的是搜索之后的胜率评估,然后AlphaGo根据这个胜率来选择落子点
  3. 人类常用的剪枝(即去芜存菁)策略:如麦肯锡的MECE+议题树
  4. 减法设计,扩大市场:苹果(Apple)公司的iPod、iPhone减法设计实务解析

主题:

寻找<圆梦伙伴>、探索<侧面市场>

  1. 圆梦伙伴:以<抬轿者>为例
  2. 携手同行,降低风险:结盟与赋能策略
  3. 战术引导战略:调整战略资源,将会赢的战术效益极大化
  4. Google团队如何调整AlphaGo的战略资源?

<分组讨论>主题:

学以致用:练习探索(自己领域的)偏锋、寻找伙伴、调整战略资源

  1. 探索侧面市场
  2. 设计利益给抬轿者(伙伴)
  3. 规划同盟的共利商业模式
  4. 实践结盟和赋能策略

~ End ~

 

发表于
2018-05-04 12:44 
SmartADT 
阅读(72
评论(0
编辑 
收藏 
举报

 

版权声明:本文为SmartADT原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/SmartADT/articles/8990111.html

课程-5. 客如何学习AlphaGo的赢家策略的更多相关文章

随机推荐

  1. 关于Mapreduce Text类型赋值的错误

    关于Mapreduce Text类型赋值的错误 or 重复赋值 Mapreduce中Text类型数据被无缘无故 […]...

  2. 如何将本地文件上传到windows服务器

    在使用windows server服务器的时候,我们都会遇到这样的问题。         在我们连接上服务器后 […]...

  3. 数据库整理

    数据库的基本知识和基本操作。不包含(事务和触发器) 创建数据库 创建数据库需要指定字符集,不然容易在插入数据时 […]...

  4. webpack 4 + mockjs

    一、创建项目目录 二、添加开发依赖( html-webpack-plugin、webpack、webpack- […]...

  5. 前端之HTML

      HTML是HyperText Markup Language的缩写,中文翻译为超文本标识语言。使用HTML […]...

  6. PS里 文字 或者图层 垂直居中 水平居中 操作

    在PS里总会用到让文字居中 水平居中的  实现的原理就是在需要做的一个背景下 实现水平和垂直居中 还是直接上图 […]...

  7. 结对项目作业

    结对作业 项目 内容 所属课设:北航2020年春软件工程 班级博客 作业要求:实现一个能求解简单几何形状之间交 […]...

  8. pat 抢红包

    L2-009. 抢红包 时间限制 300 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程 […]...

展开目录

目录导航