PyTorch学习笔记(4)Dataloader与Dataset(1)

Alysa ·
更新时间:2024-11-10
· 877 次阅读

torch.utils.data.DataLoader dataset Dataset类

决定数据从哪读取及如何读取
batchsize 批大小
num_works 是否多进程读取数据
shuffle 每个epoch 是否乱序
drop_last 当样本数不能被batchsize整除时,是否舍弃最后一批数据
Epoch 所有训练样本都已输入到模型中,成为一个Epoch
Iteration 一批样本输入到模型中,称之为一个Iteration
Batchsize 批大小 决定一个Epoch有多少个Iteration

例如

样本总数80 Batchsize 8
1Epoch = 10 Iteration
样本总数 87 Batchsize 8
1Epoch = 10 Iteration drop_last = True
1Epoch = 11Iteration drop_last = False

torch.utils.data.Dataset Dataset抽象类

所有自定义的Dataset需要继承他 并且腹泻

getitem()

#getitem: 接受一个索引 返回一个样本


作者:qq_33357094



pytorch Dataset

需要 登录 后方可回复, 如果你还没有账号请 注册新账号