deep learning with pytorch——9

Edie ·
更新时间:2024-09-20
· 590 次阅读

区间值、序数值和分类值:
1.第一种是连续值。如果你用单位来计算或测量某物,这个值可能是一个连续的值。
2.接下来是序数值。连续值的严格顺序仍然存在,但值之间的固定关系不再适用。
3.最后,分类值既没有顺序也没有数字意义。只需要不同的值来区分它们。
在这里插入图片描述
选择除最后一行外的所有行和列。
选择所有行和的最后一列。
如果要转换标签张量中的目标张量,则有两个选项,具体取决于策略或使用分类数据的方式。一种选择是将标签视为分数的整数向量:

在这里插入图片描述如果目标是字符串标签(如葡萄酒颜色),则为每个字符串指定一个整数
另一种方法是建立分数的一个热编码,也就是说,将10个分数中的每一个编码成10个元素的向量,所有元素都设置为0,但每个分数有一个不同的索引。这样,得分1可以映射到向量(1,0,0,0,0,0,0,0,0,0,0,0,0),得分5到(0,0,0,1,0,0,0,0,0,0)等等。
通过使用scatter_u方法可以实现一种热编码,该方法使用源张量中的值沿作为参数提供的索引填充张量。
在这里插入图片描述、scatter的功能。首先,注意它的名字以下划线结尾。PyTorch中的这个约定表明该方法不会返回新的张量,而是在适当的位置修改张量。scatter的理由是:
scatter的第二个参数,索引张量,需要与你所分散到的张量具有相同的维数。由于target_onehot有两个维度(4898x10),您需要使用unsqueze向target添加一个额外的虚拟维度:
PyTorch允许您在训练神经网络时直接使用类索引作为目标。但是,如果你想把分数作为网络的分类输入,你就必须把它转换成一个热编码的张量。
现在回到数据张量,包含11个与化学分析相关的变量。可以使用PyTorch Tensor API中的函数以张量形式操作数据。首先,获得每列的平均值和标准偏差:
在这里插入图片描述

在这种情况下,dim=0表示沿尺寸0进行缩减。此时,您可以通过减去平均值并除以标准差来规范化数据,这有助于学习过程。


作者:musenh



pytorch with deep

需要 登录 后方可回复, 如果你还没有账号请 注册新账号