外网设计网站2017两学一做竞赛网站
web/
2025/9/27 11:44:18/
文章来源:
外网设计网站,2017两学一做竞赛网站,国外免费服务器提供,网站优化排名工具一、DeepLabV3图像语义分割原理
DeepLabV3架构采用扩张卷积#xff08;也称为空洞卷积#xff09;来捕捉多尺度信息#xff0c;从而在不损失空间分辨率的情况下实现对图像的精细分割。
二、DeepLabV3代码及预训练权重下载
2.1 下载deeplabv3代码
这里使用的是B站大佬Bu…一、DeepLabV3图像语义分割原理
DeepLabV3架构采用扩张卷积也称为空洞卷积来捕捉多尺度信息从而在不损失空间分辨率的情况下实现对图像的精细分割。
二、DeepLabV3代码及预训练权重下载
2.1 下载deeplabv3代码
这里使用的是B站大佬Bubbliiiing复现的deeplabv3代码 仓库地址 https://github.com/bubbliiiing/deeplabv3-plus-pytorch2.2 下载模型预训练权重
链接https://pan.baidu.com/s/1dYoFxrWmwASpDKSHl4x37Q 提取码vj0h 将下载的权重文件放到model_data文件夹下。
三、labelme图像标注及格式转换
3.1 图像标注
项目代码中自行带了一张标注好的图片如下图我这边不再标注读者可以根据自己的需求自行标注。自己标注的数据的图像和标签文件需求都放在datasets\before文件夹下。
3.2 标签格式转换
运行json_to_dataset.py文件转换后会在datasets\JPEGImages文件夹下生成jpg格式图像在datasets\SegmentationClass文件夹下生成png格式mask标签。
3.3 数据集划分
将上一步的jpg格式图像放到VOCdevkit\VOC2007\JPEGImages文件夹下。 将上一步的png格式mask标签放到VOCdevkit\VOC2007\SegmentationClass文件夹下。 运行voc_annotation.py文件。 查看在VOCdevkit\VOC2007\ImageSets\Segmentation文件夹下生成的txt文件。
四、deeplabv3网络训练和测试
4.1 训练
运行train.py文件。读者需要根据自己的情况修改文件中的num_classesmodel_pathinput_shapeFreeze_batch_sizeUnfreeze_batch_size以及其他训练参数。 训练结果保存在logs文件夹下。
4.2 测试
运行predict.py文件。 读者需要根据自己的情况修改模型权重和测试图片的地址。 读者可以通过修改mode参数实现下面5种模式
# predict 表示单张图片预测如果想对预测过程进行修改如保存图片截取对象等可以先看下方详细的注释
# video 表示视频检测可调用摄像头或者视频进行检测详情查看下方注释。
# fps 表示测试fps使用的图片是img里面的street.jpg详情查看下方注释。
# dir_predict 表示遍历文件夹进行检测并保存。默认遍历img文件夹保存img_out文件夹详情查看下方注释。
# export_onnx 表示将模型导出为onnx需要pytorch1.7.1以上。设置mode “predict”模式测试一张自己手动输入路径的图像结果如下
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/82745.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!