《深度学习》笔记-正则化 - 柳絮

wangzhenghua 2021-08-03 原文


《深度学习》笔记-正则化


算法效果不仅很大程度上受影响于假设空间的函数数量,也取决于这些函数数量的具体形式。

控制算法性能的两种方式:1.允许使用的函数数量,2.这些函数的数量。

正则化是指修改学习算法,使其降低泛化误差而非训练误差。


 正则化以偏差的增加换取方差的减少,一个有效的正则化是有利的“交易”,能够显著减少方差而不过度增加偏差。

1.参数范数惩罚

正则化方法通过对目标函数J添加一个参数范数惩罚Ω(Θ),限制模型的学习能力。

选择不同的Ω,会偏好不同的解。

L2参数正则化

L1参数正则化

2.作为约束的范数惩罚

3.正则化与欠约束问题

4.数据增强

让机器泛化的更好的最好方法是使用更多的数据进行训练,解决方法:创建假数据并添加到训练集中。

5.噪声鲁棒性

方式:a.向输入添加方差极小的噪声等价于对权重施加范数惩罚

b.将噪声增加至权重。可以解释为:关于权重的贝叶斯推断的随机实现,贝叶斯学习过程将权重视为不确定的,并且通过概率分布表示这种不确定性,向权重添加噪声是反映这种不确定性的一种实用的随机方法。

6.半监督学习

7.多任务学习

通过合并几个样例来提高泛化的一种方式。

不同的监督任务共享相同的输入X,以及详细一些不同的中间层表示。能学习共同的因素池。

8.提前终止

当训练有足够的表示能力甚至会过拟合的大模型时,训练误差会随着时间的推移逐渐降低但验证集误差会再次上升。

我们需要返回使验证集误差最低的参数设置。

提前终止需要验证集,这意味着某些训练数据不能馈送到模型。

9.参数绑定和参数共享

正则化一个模型的参数,使其接近另一个无监督模式下训练的模型的参数。

10.稀疏表示

权重衰减直接惩罚模型参数,另外一种策略是惩罚神经网络中的激活单元,稀疏化激活单元。

11.Bagging和其他集成方法

Bagging是通过结合几个模型降低泛化误差之间的技术,主要思想:分别训练几个不同的模型,然后让所有模型表决测试样例的输出。

模型平均(model averaging)奏效的原因是不同的模型通常不会在测试集上产生完全相同的误差。

12.Dropout

集成大量深层神经网络的实用的Bagging方法。

在Dropout的情况下,所有模型共享参数,其中每个模型继承父神经网络参数的不同子集。

13.对抗训练

通过对抗训练减少原有独立同分布的测试集的错误率。

14.切面距离、正切传播和流形正切分类器

 

 

 

发表于
2019-11-28 09:55 
柳絮 
阅读(125
评论(0
编辑 
收藏 
举报

 

版权声明:本文为wangzhenghua原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/wangzhenghua/p/11947093.html

《深度学习》笔记-正则化 - 柳絮的更多相关文章

  1. 从进程组、会话、终端的概念深入理解守护进程

    从进程组、会话、终端的概念深入理解守护进程 一、写在前面 「守护进程」是 Linux 的一种长期运行的后台服务 […]...

  2. 【转】Android LCD(四):LCD驱动调试篇 – CSlunatic

    【转】Android LCD(四):LCD驱动调试篇 关键词:android LCD TFTSN75LVDS8 […]...

  3. ImageView.ScaleType简单介绍 – slider

      ImageView.ScaleType共八种:        1·ImageView.ScaleType. […]...

  4. 彻底封锁网内QQ——QQ服务器地址汇总 – surfer

    彻底封锁网内QQ——QQ服务器地址汇总 很多朋友问我怎么限制用户使用QQ,今天专门测试了一下。   QQ服务器 […]...

  5. 性能测试监控 – zouhui

    性能测试监控 2018-02-28 13:34  zouhui  阅读(4178)  评论(0)  编辑  收 […]...

  6. 如何使用webstorm创建html5页面 – 笑挽清风

    如何使用webstorm创建html5页面   1.首先打开webstorm,运行软件   2.软件打开以后, […]...

  7. JAVA 分布式 – 分布式介绍 – Bertha然

    JAVA 分布式 – 分布式介绍 什么是分布式系统?   要理解分布式系统,主要需要明白一下2个方 […]...

  8. 从壹开始微服务 [ DDD ] 之三 ║ 简单说说:领域、子域、限界上下文

    前言 哈喽大家好,DDD领域驱动设计系列又开始了,前天周二的那篇入门文章中,也收到了一定的效果(写小说的除外) […]...

随机推荐

  1. centos下载地址

    http://mirrors.163.com/centos http://mirrors.sohu.com/c […]...

  2. 管理Kindle的“我的剪切”

    以上内容来自http://kindlefere.com/post/20.html “我的剪贴 […]...

  3. 重构的秘诀:消除重复,清晰意图

      11年前有幸阅读了《重构——改善既有代码的设计》第一版,当时是一口气读完的,书中的内容直接惊艳到我了。   […]...

  4. [论文阅读笔记] GEMSEC,Graph Embedding with Self Clustering

    [论文阅读笔记] GEMSEC: Graph Embedding with Self Clustering 本 […]...

  5. Redis集群进阶

    Redis集群规范 本文档基于Redis 3.X或更高版本,讲解Redis集群算法以及设计原理。此文档长期更新 […]...

  6. 简单工厂模式

    一、概念   1、定义:简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。   2、角色 抽象产品角色 […]...

  7. python环境搭建-requests的简单安装(适合新手)

    python环境搭建-requests的简单安装(适合新手)   安装完python之后,一定要记住安装后的路 […]...

  8. three.js 数学方法之Box3

    从今天开始郭先生就会说一下three.js 的一些数学方法了,像Box3、Plane、Vector3、Matr […]...

展开目录

目录导航