PyTorch做身份证照片分类

怎么使用PyTorch做图片分类,图片库是身份证照片,分为三类:身份证正面、身份证反面、真人手持身份证。

首先,需要准备好身份证照片数据集。可以使用Python的PIL库将图片缩放至统一的大小,也可以使用PyTorch的`transforms.Compose()`函数进行数据增强,如随机裁剪、随机旋转、随机水平翻转等。

PyTorch图片识别注意点

PyTorch图片识别注意点

1. 图片尺寸要统一;
2. 图片格式要统一,全部jpg或全部png,不然Tensor维度不一样会报错;
3. `NeuralNetwork`的第一个`nn.Linear`函数,第一个参数要与图片尺寸保持一致,不然会报错 mat1 and mat2 shapes cannot be multiplied;
4. `NeuralNetwork`的最后一个`nn.Linear`函数,第二个参数要与分类的个数保持一致,不然会报错`target2 is out of bound`;

PyTorch第一个图片识别模型

仿照PyTorch官网的衣服的例子自己写了个图片识别模型,算是自己的第一个PyTorch模型,记录下过程。

一路踩坑是免不了的。

自定义Dataset

官网给出的`CustomImageDataset`的代码大体可用,需要根据自己的图片存入路径和csv文件格式稍做修改。

豫ICP备19001387号-1