Pytorch|用Tensor和Variable实现线性回归

Shirley ·

更新时间:2024-11-13

· 831 次阅读

Tensor

import torch as t
%matplotlib inline
from matplotlib import pyplot as plt
from IPython import display

batch_size是“一批”的大小，每处理完一批之后都会更新一次参数。如果batch_size=1，则为随机梯度下降法；1<batch_size<样本数则为小批量梯度下降；batch_size=样本数则为批量梯度下降。
这里batch_size=8=样本数，但为什么书上还是说这是随机梯度下降呢？
这个函数产生了训练集，共8个样本，每个样本的input就是一个实数，output也是一个实数，所以x是一个1*8的向量。

t.manual_seed(1000)
def get_fake_data(batch_size=8):
    '''产生随机数据：y=x*2+3 加上了一些噪声'''
    x=t.rand(batch_size,1)*20   #rand:0,1均匀分布
    y=x*2+(1+t.randn(batch_size,1))*3
    return x,y

#随机初始化参数
w=t.rand(1,1)
b=t.zeros(1,1)
lr=0.001 #学习率
for ii in range(20000):
    x,y=get_fake_data()
    #forward:计算loss
    y_pred=x.mm(w)+b.expand_as(y)
    loss=0.5*(y_pred-y)**2  #均方误差
    loss=loss.sum()
    #backward:手动计算梯度
    dloss=1
    dy_pred=dloss*(y_pred-y)
    dw=x.t().mm(dy_pred)
    db=dy_pred.sum()
    #更新参数
    w.sub_(lr*dw)
    b.sub_(lr*db)
    if ii%1000 == 0:
        #画图
        display.clear_output(wait=True)
        x=t.arange(0,20).view(-1,1)
        y=x.float().mm(w)+b.expand_as(x)
        plt.plot(x.numpy(),y.numpy()) #predicted
        x2,y2=get_fake_data(batch_size=20)
        plt.scatter(x2.numpy(),y2.numpy()) #true data
        plt.xlim(0,20)
        plt.ylim(0,41)
        plt.show()
        plt.pause(0.5)
print(w,b)

t.arange(0,20)产生的是整型numpy，为了变成浮点型，用x.float()之外，也可以把x写作t.arange(0.,20.)
plt.scatter的输入必须是numpy，所以这里用了tensor.numpy()函数；后面用Variable实现的时候也是一样（绘图时x和y都是tensor而不是Variable）。
最后的输出是这样的：
在这里插入图片描述 tensor([[2.1143]]) tensor([[3.0964]])
最后的输出是1*1的tensor，所以如果把w和b进行维度压缩的话，或许可以输出实数。

print(w.data.squeeze(0),b.data.squeeze(0))
print(w.data.squeeze(),b.data.squeeze())

结果：

tensor([1.9685]) tensor([3.1115])
tensor(1.9685) tensor(3.1115)

可见1维和0维（或许可以这么说吗）的tensor有中括号和小括号的区别。
不过书上的写法是print(w.squeeze()[0],b.sqeeze()[0])，我很不明白，而且也会报错。

Variable

import torch as t
from torch.autograd import Variable as V
%matplotlib inline
from matplotlib import pyplot as plt
from IPython import display

t.manual_seed(1000)
def get_fake_data(batch_size=8):
    x=t.rand(batch_size,1)*20
    y=x*2+(1+t.randn(batch_size,1))*3
    return x,y

w=V(t.rand(1,1),requires_grad=True)
b=V(t.zeros(1,1),requires_grad=True)
lr=0.001
for ii in range (8000):
    x,y=get_fake_data()
    x,y=V(x),V(y)
    y_pred=x.mm(w)+b.expand_as(y)
    loss=0.5*(y_pred-y)**2
    loss=loss.sum()
    loss.backward()
    w.data.sub_(lr*w.grad.data)
    b.data.sub_(lr*b.grad.data)
    w.grad.data.zero_()
    b.grad.data.zero_()
    if ii%1000 == 0:
        display.clear_output(wait=True)
        x=t.arange(0,20).view(-1,1)
        y=x.float().mm(w.data)+b.data.expand_as(x)
        plt.plot(x.numpy(),y.numpy())
        x2,y2=get_fake_data(batch_size=20)
        plt.scatter(x2.numpy(),y2.numpy())
        plt.xlim(0,20)
        plt.ylim(0,41)
        plt.show()
        plt.pause(0.5)
print(w.data.squeeze(),b.data.squeeze())

输出如下：
在这里插入图片描述

tensor(1.9373) tensor(3.0661)

这里用get_fake_data得到训练集后的第一步就是把它们转换成Variable，在更新参数、梯度清零、压缩维度时用Variable.data转换成Tensor。
前向传播和绘制拟合曲线是都用了y=wx+b，但是前向传播时x,w,b都是Variable，绘制拟合曲线时x,w,b都是Tensor。

y_pred=x.mm(w)+b.expand_as(y)  #前向传播
y=x.float().mm(w.data)+b.data.expand_as(x)  #绘制拟合曲线

是不是只要同一个式子变量数据类型符合一致就可以了呢？
其实把绘制曲线部分全部用Variable写也可以的，就像这样：

    if ii%1000 == 0:
        display.clear_output(wait=True)
        x=V(t.arange(0,20).view(-1,1))
        y=x.float().mm(w)+b.expand_as(x)
        plt.plot(x.data.numpy(),y.data.numpy())

要注意只有Tensor.numpy()而没有Variable.numpy()。
不过前向传播好像改了改会报错，但是谁会做这么没有美感的改动呢。

for ii in range (8000):
    x,y=get_fake_data()
    x,y=V(x),V(y)
    y_pred=V(x.data.mm(w.data)+b.data.expand_as(y.data))
    loss=0.5*(y_pred-y)**2
    loss=loss.sum()

报错：

RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

另：每次都要手动清零，是因为pytorch的梯度默认叠加。如果不清零的话，w和b就会变成nan，输出如下：
在这里插入图片描述

tensor(nan) tensor(nan)

作者：Yinger_2000

pytorch 回归 tensor 线性线性回归

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

深入理解HTML的FormData对象

Marmara 2020-03-22

592

gbk utf8如何选择正确理解和使用GBK及UTF-8网页编码

Brigitte 2021-08-06

924

详解.NET中string与StringBuilder在字符串拼接功能上的比较

Kersen 2021-03-27

709

CSS未知高度垂直居中的实现

Karima 2020-11-22

556

利用kernel提供的接口打印进程号(pid)

Cynthia 2020-09-01

568

分布式训练training-operator和pytorch-distributed RANK变量不统一解决

Pandora 2023-04-14

1631

基于Pytorch实现分类器的示例详解

Viveka 2023-04-18

1798

详解利用Pytorch实现ResNet网络

Tia 2023-04-20

1496

PyTorch定义Tensor及索引和切片(最新推荐)

Kara 2023-04-22

750

python windows安装cuda+cudnn+pytorch教程

Fawn 2023-05-12

646

pytorch版本PSEnet训练并部署方式

Adelaide 2023-05-13

471

PyTorch模型转换为ONNX格式实现过程详解

Tani 2023-05-27

556

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

Pytorch实现ResNet网络之ResidualBlock残差块

Kande 2023-05-27

1208

PyTorch常用函数torch.cat()中dim参数使用说明

Tricia 2023-05-27

372

用python进行线性/非线性拟合的三种方法

Endora 2023-07-20

1362

Pytorch基础教程之torchserve模型部署解析

Xylona 2023-07-20

1007

python中的torch常用tensor处理函数示例详解

Ursula 2023-07-20

1925

PyTorch模型创建与nn.Module构建

Radinka 2023-07-20

293

PyTorch模型容器与AlexNet构建示例详解

Dorothy 2023-07-20

1029

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座