机器学习关于集成算法的两种基本思想

yaniesta 2018-12-04 原文

机器学习关于集成算法的两种基本思想

 

 

 

 

集成算法

 

  1. bagging

把训练集分为B个(可重复),即bootstrap数据集,然后分别求出其中的beta值然后进行加权平均。如果每个子集的错误都是独立的,这种方法就可以减小误差。Variance一定减小。

在决策树方面,这种方法尤为有效。缺点是解释性降低。代表算法有random forest。

 

  1. boosting

每一次的迭代都要在上一次的基础之上,而不是一次性完成所有的数据集分类。后一步的分类需要关注更多(权重更大)在那些前一步分类不正确的地方上面。最后根据权重来投票决出最终结果。代表算法有adaboost 以及现阶段最为有效的XGBboost和Lgboost

 

 

 

 

发表于 2018-12-04 11:19 Yaniesta 阅读() 评论() 编辑 收藏

 

版权声明:本文为yaniesta原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/yaniesta/p/10037548.html

机器学习关于集成算法的两种基本思想的更多相关文章

随机推荐

  1. Windows Mobile同步软件使用方法

    WM同步软件能在WM设备与PC桌面之间建立连接,通过它可以: 在PC上管理设备上的存储、程序等; PC与设备之 […]...

  2. [转载] 蒲慕明教授的eMail – burellow

    [转载] 蒲慕明教授的eMail 【大约在十年前,著名的华人生物学家蒲慕明先生曾经有一封非常著名的email在 […]...

  3. java使用POI将数据导出放入Excel

    本文主要是将数据库取出的数据按照自定义的行列格式导出到excel中,POI则是实现我们需求所用到的技术。 PO […]...

  4. JS+ActiveX技术编写的无法拦截的弹出窗口

     <Script Language=”JavaScript”> var p […]...

  5. JVM架构

    JVM架构 JVM架构 JVM整体架构 1.JVM类加载器 2.JVM内存结构 3.JVM执行引擎 JVM一些 […]...

  6. HTML5学习总结-08 应用缓存(Application Cache)

    一 应用缓存(Application Cache) 1 应用缓存   HTML5 引入了应用程序缓存,这意味着 […]...

  7. MySql 查询数据库中所有表

    查询数据库中所有表名select table_name from information_schema.tab […]...

  8. Kafka安装之 Zookeeper

    一 、 Zookeeper 概述                ZooKeeper是一个分布式的,开放源码的分 […]...

展开目录

目录导航