分类算法的目标值是离散型的 如果目标值是连续型的值,就需要回归算法 比如房价预测、销售额预测、贷款额度预测等
举个栗子
期末成绩:0.7×考试成绩+0.3×平时成绩(各个特征跟某个值组合在一起去预测)
西瓜好坏:0.2×色泽+0.5×根蒂+0.3×敲声(把回归问题转换为分类问题)
一个通过属性的线性组合来进行预测的函数:
为权重,称为偏置项,可以理解为:
定义:线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合
一元线性回归:涉及到的变量只有一个
多元线性回归:涉及到的变量两个或两个以上
通用公式:
其中w,x为矩阵:
属性和权重的一种组合来预测结果
矩阵也是大多数算法的计算基础
矩阵乘法:
行列行列行行
(这线性代数我是记不住咯…)
预测结果与真实值是有一定的误差
单变量:
多变量:
回归算法是迭代的算法
损失函数(误差大小)
- y_i为第i个训练样本的真实值
- h_w (x_i)为第i个训练样本特征值组合预测函数
总损失定义:
又称最小二乘法
如何去求模型当中的W,使得损失最小?(目的是找到最小损失对应的W值)
最小二乘法之正规方程
求解: