机器学习之线性回归

2024-09-14 17:25:24 217人阅读

在统计学中，线性回归（Linear Regression）是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合（自变量都是一次方）。只有一个自变量的情况称为简单回归，大于一个自变量情况的叫做多元回归。

优点：结果易于理解，计算上不复杂。
缺点：对非线性数据拟合不好。
适用数据类型：数值型和标称型数据。
算法类型：回归算法

线性回归的模型函数如下：

hθ=θTx

它的损失函数如下：

J(θ)=12m∑i=1m(hθ(x(i))?y(i))2

求解最优解的方法有最小二乘法和梯度下降法。

梯度下降算法的思想如下(这里以一元线性回归为例)：

首先，我们有一个代价函数，假设是

首先是随机选择一个参数的组合

然后是不断改变

repeat until convergence{

θj:=θj?α??θjJ(θ0,θ1)(forj=0andj=1)

}

也就是在梯度下降中，不断重复上述公式直到收敛，也就是找到

而应用梯度下降法到线性回归，则公式如下：

θ0:=θ0?α1m∑i=1m(hθ(x(i))?y(i)) θ1:=θ1?α1m∑i=1m((hθ(x(i))?y(i))?x(i))

α为步长，当步长过大时会略过最优点，当步长过小时分析的速度会变慢，为了能获得准确的最优解，步长可小不可大。

在梯度下降中，还涉及都一个参数更新的问题，即更新

最后，上述梯度下降算法公式实际上是一个叫批量梯度下降(batch gradient descent)，即它在每次梯度下降中都是使用整个训练集的数据，所以公式中是带有

机器学习之线性回归

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们