基于线性回归的广告投入销售额预测

Francesca ·

更新时间:2024-09-21

· 881 次阅读

基于线性回归的广告投入销售额预测 目录基于线性回归的广告投入销售额预测前言基于线性回归的广告投入销量预测导入相关的库读取并查看数据基本情况查看数据维度查看数据基本统计情况数据可视化经典线性模型建立划分自变量与因变量划分训练集和测试集模型建立查看模型参数模型预测前言

学习机器学习算法最好的方法就是实战，因此笔者将利用网上的数据资源进行实践，并将实现过程与结果记录于博客中，积累实战经验，从今天开始更新。
一般学习的第一个算法模型就是经典线性模型了，因此本文将从经典线性模型开始！

基于线性回归的广告投入销量预测

某销售公司为了查找某产品的销售额与电视广告投入、收音机广告投入、报纸广告投入之间的关系，提供了过往历史数据请求进行分析。数据集具体指标说明如下：

TV：在电视上投资的广告费用（以千万元为单位）； Radio：在广播媒体上投资的广告费用； Newspaper：用于报纸媒体的广告费用； Sales：对应产品的销量（响应变量）
（本文数据来自《Python数据挖掘与机器学习实战》） 导入相关的库

import pandas as pd
import  seaborn as sns
import matplotlib.pyplot as plt

读取并查看数据基本情况

data = pd.read_csv('Advertising.csv')
data.head()

输出结果：
在这里插入图片描述
从输出的前5行结果可以看出，第一列为索引列，不纳入数据建模（后续需要去除）；数据共4个变量，其中自变量为“TV”、“Radio”、“Newspaper”，因变量为“sales”。

接下来去掉数据集中的索引项

data = data.iloc[:,1:]
data.head()

输出：
在这里插入图片描述

查看数据维度

data.shape

输出：
(200, 4)
结果表明数据集共4个特征、200条记录。

查看数据基本统计情况

data.describe()

输出：
在这里插入图片描述

data.info()

输出：
在这里插入图片描述
从输出结果看出，数据集不存在缺失值。

数据可视化

sns.pairplot(data,x_vars = ['TV','radio','newspaper'],y_vars = 'sales',height = 4,aspect = 0.8)

输出：
在这里插入图片描述
通过绘制每一个维度特征与销售额的散点图，可以大概看出，各种广告投入与销售额成正比。为了进一步查看关系，此处可以设置seaborn的kind参数，添加一条最佳拟合直线和95%的置信带。

#增加参数kind = 'reg'
sns.pairplot(data,x_vars = ['TV','radio','newspaper'],y_vars = 'sales',height = 4,aspect = 0.8,kind = 'reg')

输出：
在这里插入图片描述
可以看出”TV“、”radio“和”sales“线性关系较强，而”newspaper“和”sales“的线性关系较弱。
同时销售额是连续型数据，适合用线性回归模型进行拟合。

经典线性模型建立 划分自变量与因变量

x = data.iloc[:,:3]
y = data.iloc[:,3]

划分训练集和测试集

from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x,y,test_size = 0.25,random_state = 0)

模型建立

from sklearn.linear_model import LinearRegression
lm = LinearRegression()
lm.fit(x_train, y_train)

输出：
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

查看模型参数

print(lm.intercept_) #截距
print(lm.coef_) #回归系数

输出：
2.8925700511511483
[0.04416235 0.19900368 0.00116268]

将自变量与对应系数进行打包：

#zip函数为打包函数
#各指标回归系数
feature = ['TV','Radio','Newspaper']
a = zip(feature,lm.coef_)#python2跟python3有变化
for i in a:
    print (i)

输出：
(‘TV’, 0.04416234661149288)
(‘Radio’, 0.1990036804039404)
(‘Newspaper’, 0.0011626782879160075)

因此可以得到线性方程为： y = 2.8926 + 0.0442 * TV + 0.1990 * Radio + 0.0012 * Newspaper

查看模型的可决系数R方：

from sklearn.metrics import r2_score
y_pred1 = lm.predict(x_train)
r2_score(y_train, y_pred1)

输出：
0.9072183330817297

R方范围为0~1，越接近1说明模型拟合得越好。
因此结果达到0.9，拟合效果较优。

模型预测

#测试集上的预测
y_pred2 = lm.predict(x_test)
#可决系数
r2_score(y_test, y_pred2)

输出：
0.8576396745320892
在测试集上的R方也达到0.8以上，结果也较优。

绘制对比曲线

plt.plot(range(len(y_pred2)), y_pred2, color = 'blue', label = 'predict')
plt.plot(range(len(y_pred2)),y_test, color = 'red', label = 'test')
plt.legend(loc = 'upper right')
plt.xlabel("the number of sales")
plt.ylabel("value of sales")

在这里插入图片描述
从对比曲线可以看出，两条曲线基本重合！

以上就是基于线性回归的广告投入销售额预测的完整过程。

（本文数据来自《Python数据挖掘与机器学习实战》）

作者：*蓝天翔*

销售回归线性线性回归广告

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

JavaScript 对象实例

Sabah 2021-08-07

951

深入理解HTML的FormData对象

Marmara 2020-03-22

592

gbk utf8如何选择正确理解和使用GBK及UTF-8网页编码

Brigitte 2021-08-06

924

CSS未知高度垂直居中的实现

Karima 2020-11-22

556

强制删除rpm包的方法

Carly 2020-04-10

527

C语言数据结构不挂科指南之线性表详解

Gella 2022-11-04

1109

Android App实现闪屏页广告图的全屏显示实例

Maha 2022-11-05

1249

Python图像处理之图像的灰度线性变换

Adonia 2022-11-06

674

PythonPaddlePaddle机器学习之求解线性模型

Vevina 2022-11-06

825

Android嵌套线性布局玩法坑解决方法

Heather 2022-11-07

1639

Python灰度变换中的分段线性函数专项分析实现

Catherine 2022-11-09

1964

pytorch逻辑回归实现步骤详解

Rhoda 2022-11-09

262

python实现线性插值的示例

Dulcea 2022-12-07

1375

JS根据当天不同时间显示不同广告的代码

Miette 2023-02-10

630

js不同客户端显示不同广告(pc端+移动端+微信端)

Serafina 2023-02-10

395

Python利用keras接口实现深度神经网络回归

Tina 2023-02-18

418

Python基于TensorFlow接口实现深度学习神经网络回归

Lark 2023-02-18

364

Matlab利用随机森林(RF)算法实现回归预测详解

Tesia 2023-02-18

326

Python实现随机森林回归与各自变量重要性分析与排序

Dulcea 2023-02-20

1012

基于Matlab实现人工神经网络(ANN)回归的示例详解

Tallulah 2023-02-26

1622

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座