损失函数 - 努力的孔子

yanshw 2021-08-05 原文


损失函数


损失函数,也可叫做 目标函数、代价函数 等,其意义不是完全一致,但是大体相同,不必纠结概念

 

0-1 损失:Zero-one loss

预测与实际相等为 0,不相等为 1;

缺点:定义太过严格,比如预测为 0.99,实际为 1,显然预测没问题,但是上述损失为  1

应用:不常用

感知损失:Perceptron Loss

它是对 0-1 损失的改进,允许有一定的误差

预测与实际在误差范围内为 0,超过误差范围为 1 

应用:不常用 

 

 

铰链损失:Hinge loss

解决间隔最大化问题

y 为实际,y‘ 为预测;

在 SVM 中,y‘ 取值在 -1 到 1 之间,不鼓励 |y\’| > 1,这意味着模型过度自信,让单个正确分类的样本距离分割线超过 1 时,yy‘ > 1,1 – yy‘ < 0,而 hinge loss 强制取 0,这意味着 负数并不会对模型的优化起到减小损失的作用,

这样做使得 SVM 更专注于整体的误差

如果预测正确,损失为 0;

如果预测错误,yy‘ < 0,损失为 1-yy‘;

优点:健壮性好,噪声不敏感

缺点:缺乏很好的概率解释

应用:SVM 解决几何间隔最大化

在线性支持向量基中,loss 如下

作如下变形

loss 变成

 

 

对数损失:log 损失

log 损失的本质是对数似然函数;      【在交叉熵中有解释】

它包含了 cross-entropy loss 和 softmax loss;

它适用于 输出概率 的分类模型;

注意 P(Y|X) 表示 softmax 之后,真实 label 对应的那个概率,是单个值,不同于下面的交叉熵,交叉熵里面 y 和 a 都是 一个 概率向量;

缺点:log 或者 exp 都是放大了错误,这样使得模型对噪声敏感

应用:逻辑回归,softmax 分类

交叉熵:cross-entropy loss

x 表示样本, y 表示实际, one-hot,a 表示预测,是一组概率,n 为样本数

 

交叉熵的本质是 对数似然函数

p 为发生的概率,y 为发生 or 未发生,0 or 1;  【p 为实际,y 为预测】

应用:最常用的二分类损失函数

 

 

指数损失

如果预测正确,yf(x) 为正,-yf(x) < 0,loss 变小,exp(-yf(x)) < 1;

如果预测错误,yf(x) 为负,-yf(x) > 0,loss 变大,exp(-yf(x)) > 1;

加 exp 的作用是放大 错误;

缺点:log 或者 exp 都是放大了错误,这样使得模型对噪声敏感

应用:Adaboost

 

 

绝对值损失

也叫 L1 范数损失,L1 loss

应用:回归

均方差 

应用:最常用的回归损失函数

 

 

 

以上损失函数可视化如下图

 

 

 

参考资料:

https://www.cnblogs.com/lliuye/p/9549881.html

https://blog.csdn.net/zhangjunp3/article/details/80467350    这篇讲得比较深入

https://zhuanlan.zhihu.com/p/58883095

https://zhuanlan.zhihu.com/p/35027284

https://zhuanlan.zhihu.com/p/47202768

https://mp.weixin.qq.com/s/qWJaMTHNAh4cxEIhfpURDA

发表于
2020-03-03 10:52 
努力的孔子 
阅读(343
评论(0
编辑 
收藏 
举报

 

版权声明:本文为yanshw原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/yanshw/p/10721400.html

损失函数 - 努力的孔子的更多相关文章

  1. Raspberry Pi(树莓派)试用小记 – ma6174

    Raspberry Pi(树莓派)试用小记   近期入手一树莓派卡片机,体验了一下它的强大,写篇报告,推广一下 […]...

  2. 产品案例分析 – 华为软件开发云

    0. 调研,评测 1. 分析 2. 建议和规划 产品案例分析 – 华为软件开发云 PART1 &# […]...

  3. [基础控件:Winform布局篇(傻瓜都会的winform) + Dock属性引起的界面布局混乱]

    此问题也是无意间发现的,一直做的是.NET Web应用程序,在处理一些繁琐,重复的工作的时候就想写个小工具出来 […]...

  4. myeclipse安装 配置Maven3 – 高董

    myeclipse安装 配置Maven3 myeclipse自带了maven插件,但是和原生插件还是有点不一样 […]...

  5. WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义 – 长456风

    WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义 […]...

  6. [源码解析] 深度学习分布式训练框架 horovod (19) — kubeflow MPI-operator

    Horovod 是一款基于 AllReduce 的分布式训练框架。本文是 Horovod on k8s 第二篇 […]...

  7. 总结ajax 实现原理和步骤 – Itwangchen

    总结ajax 实现原理和步骤 一 Ajax技术与原理 1.1 Ajax简介 AJAX = Asynchrono […]...

  8. 【555】folium 更换底图 – McDelfino

    【555】folium 更换底图 参考:Python地图可视化之Folium更换地图瓦片(Map Tiles) […]...

随机推荐

  1. BIOS设置之UEFI/Legacy BIOS切换图文详解 – 夜来风雨香

    BIOS设置之UEFI/Legacy BIOS切换图文详解 近几年出现的电脑其中相当一部分都配置了UEFI B […]...

  2. 几个不错的APP网站。

      http://www.yunshipei.com/yunshipei.html http://www.ap […]...

  3. axios忽略SSL证书,不校验https证书

    在 node.js 中使用 axios 时,有时需要忽略 SSL 证书,在百度搜半天都搜不到,最后在 axio […]...

  4. 预测房价:人工智能回归问题

    ​我们之前提出了三个经典的问题,他们分别是: 二分类问题(电影评论好坏倾向性判断) 多分类问题(将新闻按照主题 […]...

  5. Vue项目引入字体(思源黑体) – a-dou

    Vue项目引入字体(思源黑体) 一、通过Google Fonts资源引入字体方式 在项目index.html […]...

  6. Linux 添加新用户账号并赋予root权限

    除了root用户之外,通常需要为每个管理创建各自的用户账号,方便每个管理员登录使用, 步骤如下: 1.  添加 […]...

  7. java多线程系列(八)—CountDownLatch和CyclicBarrie

    CountDownLatch 前言:如有不正确的地方,还望指正。 目录 认识cpu、核心与线程 java多线程 […]...

  8. Eclipse SWT开发入门[转]

    SWT(Standard Widget Toolkit,标准窗口小部件工具包)本身仅仅是Eclipse组织为了 […]...

展开目录

目录导航