首页 >>  正文

回归直线方程公式图片

来源:baiyundou.net   日期:2024-08-27

线性回归可以理解为一个回归算法,我们可以结合线性回归算法来做预测值。这篇文章里,作者就总结了线性回归算法的基本原理、应用场景、优劣势等方面,一起来看看吧。

前两篇文章我们介绍了两个解决分类问题的算法:K近邻和朴素贝叶斯,今天我们一起来学习回归问题中最经典的线性回归(Linear Regression)算法。

一、基本原理

生活中,大家都排过队,我印象最深的应该是排队做核酸的队伍,前后间隔一米,随着做核酸的人越来越多,新来的人看到队伍,都会自动排到队伍的末尾,同样间隔一米,大家“齐心协力”排出了一条长线。

有了这条长线之后,我们就可以对新来的人排队的位置做出预测,这就是线性回归的基本逻辑。

所以线性回归算法的思路就是:根据已有的数据去寻找一条“直线”,让它尽可能的接近这些数据,再根据这条直线去预测新数据的结果

那么具体要怎么找这条“直线”呢?初中数学里描述一条直线时,用的是一元一次方程:y=ax+b,这里的a表示直线的斜率,b表示截距,如下图所示:

以排队为例,我们已知x是人的顺序,y是排的位置,将已有的x和y数据代入到公式中,可以得到一组合适a和b的值来描述这条直线,也就是我们找到了这条直线的分布。

排队的例子比较简单,只有一个x变量,在实际的应用中,会有很多个影响结果的变量,比如预测贷款额度时,会有工资、是否有房等变量,用线性回归的思路解决类似的问题,就要构建多元回归方程了,公式也就变成了 y = a1x1 + a2x2 + … + b

当有两个变量时,线性回归的分布也就不是一条简单的直线了,而是一个平面,如下图所示:

如果有更多的变量,分布就是一个超平面,找到它的分布也会变得更复杂。

二、如何计算最优解

如果每个人的站位(实际值)距离理想站位(预测值)的距离(误差)最小,那就说明我们得到的线性回归分布是最优解。

机器学习中,评价模型的预测值和实际值差异的公式叫做损失函数,损失函数值越小,模型性能越好。

平方残差和就是一种场景的损失函数,其计算公式为 loss=SUM(真实值-预测值)²,就是把每个节点的预测差求平方再求和,前面回归模型评估的文章里提到的MSE就是平方残差和除以样本数量。

三、应用场景

线性回归的应用场景非常广泛,只要数据是符合线性分布的,理论上都可以用线性回归来进行预测:

  • 预测房价:通过分析房屋特征(如面积、位置、房间数量等)与价格之间的关系。
  • 预测员工绩效:通过分析员工的教育背景、工作经验、培训等因素与绩效之间的关系。
  • 营销分析:分析市场调研数据,预测产品销售量,并确定哪些因素对销售量有显著影响。
  • 交通规划:预测交通流量,通过分析道路特征、人口密度等因素与交通流量之间的关系。
  • 环境科学:分析环境数据,如气候变化、污染物排放等因素与生态系统的影响。

四、优缺点

线性回归算法的优点:

  • 简单而直观:易于理解和解释,适用于初学者入门。
  • 计算效率高:计算速度较快,适用于大规模数据集。
  • 可解释性强:可以提供每个特征对目标变量的影响程度,有助于理解变量之间的关系。
  • 可扩展性强:可以通过添加交互项、多项式特征等进行扩展,以适应更复杂的数据模式。

线性回归算法的缺点:

  • 仅适用于线性关系:线性回归假设自变量与因变量之间存在线性关系,对于非线性关系的数据拟合效果较差。
  • 对异常值敏感:线性回归对异常值较为敏感,异常值的存在可能会对模型的拟合产生较大影响。
  • 忽略了特征之间的复杂关系:线性回归无法捕捉到特征之间的非线性、交互作用等复杂关系。
  • 对多重共线性敏感:当自变量之间存在高度相关性时,线性回归模型的稳定性和可靠性可能会受到影响。

五、总结

本文我们介绍了线性回归算法的原理、应用场景和优缺点,线性回归是一个回归算法,常用来做预测值,和之前介绍的分类模型的输出是有区别的,需要注意一下。

下篇文章,我们来聊一聊逻辑回归算法,敬请期待。

本文由 @AI小当家 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

","gnid":"986e0d62b5c4aaf5e","img_data":[{"flag":2,"img":[{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01b35250c3375c56e0.jpg","width":"900"},{"desc":"","height":"710","title":"","url":"https://p0.ssl.img.360kuai.com/t01e230685f98f732cc.jpg","width":"1323"},{"desc":"","height":"783","title":"","url":"https://p0.ssl.img.360kuai.com/t01dda68d216e4588bb.jpg","width":"720"}]}],"original":0,"pat":"art_src_3,sexf,sex4,sexc,fts0,sts0","powerby":"pika","pub_time":1705890180000,"pure":"","rawurl":"http://zm.news.so.com/f1804ee21bcc84664ec444b1a1980982","redirect":0,"rptid":"6c6c54f1e1479e00","rss_ext":[],"s":"t","src":"人人都是产品经理","tag":[],"title":"线性回归算法:用“线性外推”的思路做预测

宫瞿生791回归方程中a,b怎么求 -
宇储卞19754327444 ______ 回归直线的求法 最小二乘法: 总离差不能用n个离差之和 来表示,通常是用离差的平方和,即 作为总离差,并使之达到最小,这样回归直线就是所有直线中Q取最小值的那一条,这种使“离差平方和最小”的方法,叫做最小二乘法: 由于绝对值使得计算不变,在实际应用中人们更喜欢用:Q=(y1-bx1-a)²+(y2-bx-a²)+...+(yn-bxn-a)² 这样,问题就归结于:当a,b取什么值时Q最小,即到点直线y=bx+a的“整体距离”最小. 用最小二乘法求回归直线方程中的a,b有下面的公式:

宫瞿生791回归方程怎么看?有么有及时简单的方法? -
宇储卞19754327444 ______ 回归直线方程 若:在一组具有相关关系的变量的数据(x与Y)间,通过散点图我们可观察出所有数据点都分布在一条直线附近,这样的直线可以画出许多条,而我们希望其中的一条最好地反映x与Y之间的关系,即我们要找出一条直线,使这条...

宫瞿生791高中数学必修3:回归直线方程 -
宇储卞19754327444 ______ 回归方程一定经过样本平均数点 先看x:平均数为(0+1+2+3)/4 = 3/2 y:(1+3+5+7)/4 = 4 所以一定经过(3/2 ,4)

宫瞿生791回归平方和计算公式
宇储卞19754327444 ______ 回归平方和计算公式:R^2=SSR/SST=1-SSE/SST,回归平方和ESS(Explained Sum of Squares)是因变量回归值ŷ-因变量平均值y的离差平方和,数值上=∑(ŷ-ȳ)2,也称为解释平方和.用回归方程或回归线来描述变量之间的统计关系时,实验值yi与按回归线预测的值ŷ并不一定完全一致.ESS越大说明多元线性回归线对样本观测值的拟合情况越好.

宫瞿生791已知回归直线的斜率估计值是1.16,样本点的中心(3,5),则回归直线的方程是什么...
宇储卞19754327444 ______ 回归直线的斜率估计值为1.16 说明是一元线性回归,模型方程为Yi=α+βXi,β=1.16 样本点的中心为(3,5) 即样本均值为x=3,y=5 一元线性回归的回归线经过样本均值,将值带入Yi=α+βXi,α=1.52 回归直线的方程是Yi=1052+1.16Xi 祝学习进步,望采纳~

宫瞿生791如何用excel制作线性回归方程的图 -
宇储卞19754327444 ______ 方法/步骤 先是将数据录入到excel中,下面我是顺便编了一组数据,不算好看,只要大家懂就行了.插入XY散点图,点击进入“下一步”.点击箭头所示图标,将X轴数据选中,点回车键返回到这个界面.系列产生在“行”.点击上面的“系列”,按上述方法将X值Y值分别选中.其它的什么命名大家应该都会,我就直接点击“完成"了.此时就可以得到下图所示的散点图.然后双击任何一个散点,进入下面这个界面.类型可以根据自己需要进行选择.点击上面的”选项“,将”显示公式“打勾,点击确定即可.8 此时就得到了下面所示的线性回归方程的图形,斜率也可以直接从图形中读出.

宫瞿生791某商店统计了最近6个月某商品的进价x(元)与售价y(元)的对应数据如下表:x 3 5 2 7 8 11y 4 6 3 9 12 14则回归直线方程是y=7356x+825y=7356x+825.注... -
宇储卞19754327444 ______[答案] ∵ . x= 3+5+2+7+8+11 6=6, . y= 4+6+3+9+12+14 6=8 b= ni=1xiyi−n.x•.y ni=1xi2−n.x2= 12+30+6+63+96+154−6*6*8 9+25+4+49+64+121−6*36= 73 56 a= . y-b . x=8- 73 56*6= 8 25 ∴回归直线方程是y= 73 56x+ 8 25 故答案为:y= 73 56x+ 8 25

宫瞿生791成本分析中的“回归直线法”如何理解 -
宇储卞19754327444 ______ 两个变量的相关关系最简单的形式就是直线相关,其直线方程称为一元一次方程.即:إ y=a+bxإ 式中,y为因变量,x为自变量,a与b是特定参数.a为直线的截距,b为直线斜率又称回归系数.参数a、b的确定方法有随手画法、最小平方法,统...

宫瞿生791数学高手快来,已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线的回归方程是?
宇储卞19754327444 ______ 设回归直线方程为 y=1.23x+b 样本点的中心(4,5)代入,得5=1.23*4+b b=0.08 回归直线的回归方程:y=1.23x+0.08

宫瞿生791 若回归直线方程中的回归系数b=0时,则相关系数r=______. -
宇储卞19754327444 ______[答案] 由于在回归系数b的计算公式中, 与相关指数的计算公式中, 它们的分子相同, 故 答案为:0.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024