博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
正则化
阅读量:6422 次
发布时间:2019-06-23

本文共 600 字,大约阅读时间需要 2 分钟。

正则化(避免过拟合)

如何解决过拟合问题:

过拟合问题往往源自过多的特征,通常会考虑两种途径来解决:

a) 减少特征的数量:

-人工的选择保留哪些特征;

-模型选择算法(之后的课程会介绍)

b) 正则化

-保留所有的特征,但是降低未知量的系数值;

-正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量。这里主要通过两个方面谈谈正则化问题。

1)对代价函数进行正则化

过拟合

 

直观来看,如果我们想解决这个例子中的过拟合问题,最好能将x3,x4的影响消除,也就是让 , 劲量趋于0

假设我们对 , 进行惩罚,并且令其很小,一个简单的办法就是给原有的Cost function加上两个略大惩罚项,例如:

 

这样在最小化Cost function的时候, , 都趋于0.

正则化:

参数 , 取小一点的值,来劲量“简化”的hypothesis,避免出现过拟合;

我们对 进行惩罚,也就是正则化:

 

经过正则化的Cost Function有如下的形式:

 

其中 称为正则化参数.

 

2)线性回归的正则化和逻辑回归的正则化

线性回归的正则化和逻辑回归的正则化的思路和上面都差不多,主要是通过对代价函数进行正则化处理,如

线性回归

 

逻辑回归

 

然后利用梯度下降或者是梯度上升算法来求解目标函数。

 

转载于:https://www.cnblogs.com/Hailong-Said/p/4917516.html

你可能感兴趣的文章
NGINX引入线程池 性能提升9倍
查看>>
《淘宝技术这十年》读书笔记 (四). 分布式时代和中间件
查看>>
linux下mongodb定时备份指定的集合
查看>>
oVirt JBAS server start failed, ajp proxy cann't server correct. ovirt-engine URL cann't open
查看>>
CDP WebConsole上线公告
查看>>
ubuntu下安装摄像头应用程序xawtv
查看>>
PostgreSQL 如何比较两个表的定义是否一致
查看>>
Ambari安装Hadoop集群
查看>>
WCF学习之旅—基于ServiceDebug的异常处理(十七)
查看>>
CLREX
查看>>
再也不用担心this指向的问题了
查看>>
PHP那些事儿
查看>>
使用putty远程连接linux
查看>>
【comparator, comparable】小总结
查看>>
Node 版本管理
查看>>
34、重分布配置实验之分发列表distribute-list
查看>>
命令模式-对象行为型
查看>>
VS2017配置、提高生产力、代码辨识度 (工欲善其事必先利其器)新手必备!
查看>>
[Phoenix] 七、如何使用自增ID
查看>>
路由基本配置(上)
查看>>