第八章变量选择与正则化 - 岭回归分析

Elaine ·

更新时间:2024-09-21

· 621 次阅读

岭回归分析0 载入库1 数据预处理2 普通线性回归和岭回归2.1 最小二乘法，参数估计2.2 岭回归，参数估计，固定岭参数2.3 岭回归，按 CV 标准自动选择岭参数2.4 列举岭参数的值，计算回归参数，画出岭迹图，计算 VIF 0 载入库

载入 sklearn 模块中的线性回归与岭回归的函数

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
np.set_printoptions(suppress=True) #不用科学计数法输出
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Ridge 
from sklearn.linear_model import RidgeCV

1 数据预处理

将自变量和因变量中心化和标准化

mydata=pd.read_csv('Regression/Regression8/longley.csv')
mydata_normd = (mydata - mydata.mean()) / mydata.std()
A = np.asmatrix(mydata_normd) #将输入解释为矩阵
X = A[:,1:]
y = A[:,0]

2 普通线性回归和岭回归 2.1 最小二乘法，参数估计

reg01 = LinearRegression()
reg01.fit(X,y)
print('OLS score:', reg01.score(X,y).round(4))
print('OLS coefficients:', reg01.coef_.round(3))

2.2 岭回归，参数估计，固定岭参数

reg02 = Ridge(alpha=0.016)
reg02.fit(X,y)
print('Ridge(alpha=0.016) score:', reg01.score(X,y).round(4))
print('Ridge(alpha=0.016) coefficients:', reg02.coef_.round(3))

岭回归，给定一些岭参数，画出岭迹图

alphas = np.linspace(0,0.3,51)
betas = np.zeros((51,6))
for i in range(51):
    reg03 = Ridge(alpha=alphas[i])
    reg03.fit(X,y)
    betas[i] = reg03.coef_
ax = plt.gca()
ax.plot(alphas, betas)
plt.xlabel('k')
plt.ylabel('beta(k)')
plt.title('Ridge coefficients as a function of k')
plt.grid(True)

在这里插入图片描述

2.3 岭回归，按 CV 标准自动选择岭参数

alphas = np.linspace(0.0001,0.1,1000)
reg04 = RidgeCV(alphas)
reg04.fit(X,y)
print('RidgeCV score:', reg04.score(X,y).round(4))
print('RidgeCV alpha:', reg04.alpha_)
print('RidgeCV coefficients:', reg04.coef_.round(3))

在这里插入图片描述

2.4 列举岭参数的值，计算回归参数，画出岭迹图，计算 VIF

B = np.dot(X.T,X)
E6 = np.diag(np.ones(6))
Nk = 101
k = np.linspace(0,0.2,Nk)
beta = np.zeros((Nk,6))
for i in range(Nk):
    Binv = np.linalg.inv(B + k[i] * E6)
    beta[i] = np.dot(np.dot(Binv, X.T), y).T

画图模型整段运行

for i in range(6):
    plt.plot(k, beta[:,i] ,'-', label='beta_{}'.format(i+1))
plt.legend(loc='upper right')
plt.grid(True)
plt.xlabel('k')
plt.ylabel('beta hat (k)')

在这里插入图片描述

计算VIF

VIF=np.zeros((Nk,6))
for i in range(Nk):
    Binv=np.linalg.inv(B+k[i]*E6)
    C=np.dot(np.dot(Binv,B),Binv)
    VIF[i]=np.diag(C)
VIF

评价回归方程的准则 在这里插入图片描述

作者：喝醉酒的小白

岭回归选择正则化回归正则变量

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 脚本

Jenny 2021-05-16

709

NumPy 数据类型

Grace 2021-01-07

588

CSS未知高度垂直居中的实现

Karima 2020-11-22

556

Laravel 解决composer相关操作提示php相关异常的问题

Hayley 2021-01-17

885

纯css实现树形结构的示例代码

Clementine 2020-03-06

698

在 RHEL8 /CentOS8 上建立多节点 Elastic stack 集群的方法

Bliss 2020-04-24

825

Python中变量的作用域的具体使用

Pandora 2023-06-12

1650

Java判断变量是否为空问题的方法总结

Kathy 2023-07-02

1763

Python如何使用正则表达式识别代码中的中文、英文和数字

Serafina 2023-07-19

1832

正则表达式之字符组简记法与字符组运算

Kathy 2023-07-19

1783

正则表达式之字符组[ ](Character Classes)

Nora 2023-07-19

316

正则基础之捕获组(capture group)

Pandora 2023-07-19

450

Web 前端常用正则校验规则整理(常用示例)

Tani 2023-07-19

416

notepad++中使用正则表达式处理数据的步骤

Tanisha 2023-07-19

416

shell脚本ssh远程执行命令给变量赋值的问题解决

Nissa 2023-07-20

1066

shell脚本declare命令的用法详解(声明变量的属性和类型)

Oceana 2023-07-20

C#如何打开选择文件对话框和选择目录对话框

Xanthe 2023-07-20

417

Python顺序结果、选择结构和循环结构详解

Samira 2023-07-20

1624

一文带你了解Python中的注释及变量

Viveka 2023-07-20

1662

一文介绍Python中的正则表达式用法

Halima 2023-07-20

1385

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座

第八章 变量选择与正则化 - 岭回归分析

致谢

第八章变量选择与正则化 - 岭回归分析