2%01,在正则项上没有添加 2 根号是为了更加容易优化
会产生稀疏特性
会产生更多地特性但是都会接近于
会趋向于产生少量特性,而其她特性都是 ,而 会选取更多特性,这些特性都会接近
于 。 在特性选取时候非常有用,而 就只是一种规则化而已。
求解
最小角回归算法:3 算法
、越小参数阐明模型越简朴
过拟合,拟合会通过曲面每个点,也就是说在较社区间里面也许会有较大曲率,这里导数就
是很大,线性模型里面权值就是导数,因此越小参数阐明模型越简朴。
、为什么某些机器学习模型需要对数据进行归一化?
归一化化就是要把你需要解决数据通过解决后(通过某种算法)限制在你需要一定范畴内。
)归一化后加快了梯度下降求最优解速度。等高线变得显得圆滑,在梯度下降进行求解时
能较快收敛。如果不做归一化,梯度下降过程容易走之字,很难收敛甚至不能收敛
)把有量纲表达式变为无量纲表达式,有也许提高精度。某些分类器需要计算样本之间距
离(如欧氏距离),例如 44。如果一种特性值域范畴非常大,那么距离计算就重要取决于
这个特性,从而与实际状况相悖(例如这时实际状况是值域范畴小特性更重要)
, 逻辑回归等模型先验假设数据服从正态分布。
哪些机器学习算法不需要做归一化解决?
概率模型不需要归一化,由于它们不关怀变量值,而是关怀变量分布和变量之间条件概率,
如决策树、'。而像 56--、65、06--、%、*、44、 之类最优化问题就
需要归一化。
特性向量归一化办法
评论0
最新资源