(windows)yolov5/yolov3训练自己的数据集,win11 gpu,pycharm,RTX3050笔记

news/2024/4/17 10:43:30
  1. 虚拟环境配置

yolov5/yolov3 pytorch环境配置gpu+windows11+anaconda+pycharm+RTX3050 笔记环境配置完成后yolov3和yolov5都可以使用,数据集和yaml文件通用,训练步骤相同,本人已经在验证。

  1. 原始图像文件和xml

我已经有jpg图像文件(JPEGImages)和对应的xml标注文件(Annotations)和数据集文件分布,制作方法见Labelimg图像标注

  1. 转换为yolo格式代码如下

参考yolov5训练—VOC数据集划分(训练集、验证集、测试集)和转换YOLO格式

3.1划分数据集的split_train_val.py代码

import os
import random
import argparseparser = argparse.ArgumentParser()
# ***为该数据集的绝对路径
parser.add_argument('--xml_path', default='***/Annotations', type=str, help='input xml label path')
parser.add_argument('--txt_path', default='***/ImageSets/Main', type=str, help='output txt label path')
opt = parser.parse_args()trainval_percent = 0.9  # 训练集和验证集所占比例。
train_percent = 0.7     # 训练集所占比例,可自己进行调整
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):os.makedirs(txtsavepath)num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')for i in list_index:name = total_xml[i][:-4] + '\n'if i in trainval:file_trainval.write(name)if i in train:file_train.write(name)else:file_val.write(name)else:file_test.write(name)file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行结果如下

3.2 xml转txt文件的xml2txt代码

import xml.etree.ElementTree as ET
import os
sets = ['train', 'val', 'test']  # 如果你的Main文件夹没有test.txt,就删掉'test'
# classes = ["a", "b"]   # 改成自己的类别,VOC数据集有以下20类别
classes = ["Person", "Elephant", "Lion", "Giraffe"]  # class names
abs_path = '***' # ***该数据集的绝对路径def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = (box[0] + box[1]) / 2.0 - 1y = (box[2] + box[3]) / 2.0 - 1w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn x, y, w, hdef convert_annotation(image_id):in_file = open(abs_path + '/Annotations/%s.xml' % (image_id), encoding='UTF-8')out_file = open(abs_path + '/labels/%s.txt' % (image_id), 'w')tree = ET.parse(in_file)root = tree.getroot()size = root.find('size')w = int(size.find('width').text)h = int(size.find('height').text)for obj in root.iter('object'):# difficult = obj.find('difficult').text# difficult = obj.find('Difficult').textcls = obj.find('name').text#if cls not in classes or int(difficult) == 1:#    continuecls_id = classes.index(cls)xmlbox = obj.find('bndbox')b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),float(xmlbox.find('ymax').text))b1, b2, b3, b4 = b# 标注越界修正if b2 > w:b2 = wif b4 > h:b4 = hb = (b1, b2, b3, b4)bb = convert((w, h), b)out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')for image_set in sets:if not os.path.exists(abs_path + '/labels/'):os.makedirs(abs_path + '/labels/')image_ids = open(abs_path + '/ImageSets/Main/%s.txt' % (image_set)).read().strip().split()list_file = open(abs_path + '/%s.txt' % (image_set), 'w')for image_id in image_ids:list_file.write(abs_path + '/JPEGImages/%s.jpg\n' % (image_id))  # 要么自己补全路径,只写一半可能会报错convert_annotation(image_id)list_file.close()

最后运行结果

  1. yolo.yaml文件配置(该文件写好后放在yolov3或yolov3的data文件下)

# YOLOv5 yolov3
# 该文件存放在YOLOv5 3的/models中
# 文件夹的相对位置如下
# parent
# ├── yolo (yolov3 v5算法文件夹)
# └── datasets
#     └──DATA (数据集的名称)
# **为数据集绝对路径,注意冒号 : 和路径之间必须有一个空格
train: **/train.txt
val: **/val.txt
test: **/test.txt# Classes
nc: 5  # number of classes ##class数目
names: ['A',  'B',  'C',  'D',  'E']  # class names名称
  1. yolov5/yolov3训练过程

下载算法文件及相应模型

yolov5链接https://github.com/ultralytics/yolov5 ,下载后解压缩

yolov3链接https://github.com/ultralytics/yolov3 ,下载后解压缩

yolov3.pt yolov5s.pt下载Releases · ultralytics/yolov5 (github.com),找到所示点击,选择相应的模型下载

将相应的pt模型移入对应的算法文件中

用pycharm打开yolov3或yolov5文件,并配置相应的虚拟环境

yolov5/yolov3 pytorch环境配置gpu+windows11+anaconda+pycharm

修改train.py

打开根目录下的train.py

Ctrl+f搜索--data

将coco128.yaml改为你自己配置文件的文件名**.yaml

修改yolov5s.yaml yolov3.yaml

model/yolov5s.yaml 或yolov3.yaml的nc值为自己数据集的class数目 nc

修改dataloaders.py(如果你的图片文件夹名是images可以略过)

打开utils/dataloaders.py

Ctrl+f搜索Define label ,找到下面的一行内容:

sa, sb =f'{os.sep}images{os.sep}',f'{os.sep}labels{os.sep}' # /images/,/labels/ substrings

JPEGImages替换掉images

运行

pycharm打开终端,如果你选择了相应的虚拟环境,()内就会显示你的虚拟环境名称

在终端粘贴指令

yolov5选择指令(有gpu):

python train.py --img 640 --batch 32 --epochs 100 --data data/***.yaml--weights yolov5s.pt --device 0

yolov3选择指令(有gpu):

python train.py --img 640 --batch 32 --epochs 100 --data data/***.yaml--weights yolov3.pt --device 0

Enter运行即可

关于Linux上yolov3/v5环境配置及训练过程,可以参考:

(linux)yolov5/v3-pytorch目标检测1:环境配置gpu+anaconda+pycham+ RTX2080ti 笔记_chao_xy的博客-CSDN博客

(linux)yolov5/v3-pytorch目标检测2:训练自己的数据集,gpu,pycharm, RTX2080ti,单/多显卡训练,笔记_chao_xy的博客-CSDN博客


http://www.ppmy.cn/news/168264.html

相关文章

3050芯片(但是基本适应大部分)安装pytorch深度学习框架历程

一、安装CUDA 在NVIDIA的官网可以查看显卡算力图,以下网址是由官网进去的: CUDA GPUs - Compute Capability | NVIDIA Developer 点击以下图标就可以查看显卡的算力分布表 之后点击下面网址进行历史版本安装: CUDA Toolkit Archive | NVI…

3050显卡驱动安装+配置pytorch的cuda环境

3050显卡驱动安装配置pytorch的cuda环境 前言一、下载3050驱动二、下载CUDA二、cuDNN下载三、cuDNN配置四、pytorch环境配置①、创建虚拟环境 前言 因为有一块3050的显卡,更新驱动的时候把之前配好的cuda10.0覆盖了,因此需要重新配置一下环境。记录一下…

poj3050

一、题意:有一个5*5的矩形,每个单元格有一个数字。可以从任一个单元格出发,然后可朝上下左右四个方向移动。走五步即可得到一个六位数(可以有前导零),求能得到的不同六位数最多有多少个。 二、思路&#xf…

三轴陀螺仪MPU3050驱动解析

MPU3050是invensense公司的三轴陀螺仪芯片,三轴陀螺仪最大的作用就是“测量角速度,以判别物体的运动状态,所以也称为运动传感器. 下图是MPU3050的系统框图,芯片有1个中断引脚,可以通过i2c来控制,获取x Gyro,y Gyro,z Gyro 设备驱动…

3050ti跑tensoflow-gpu,屡次碰壁,总结原因如下

项目场景: 例如:新电脑到了,配置是3050ti 4G 其他参数都是比较平均的,安装好基础软件之后,上深度学习。 问题描述 在挣扎后回忆起怎么安装显卡驱动了,看到配置版本tf2.0配的cuda是10.0,cudnn是7.4,安装成…

win11+3050+pytorch深度环境配置

目录 1、驱动安装 2、安装anaconda和pycharm 2.1、安装anaconda 2.1.1、下载anaconda安装包 2.1.2、安装 2.2、安装pycharm 2.2.1、下载安装包 2.2.2、安装 3、安装CUDA和cudnn 3.1、安装CUDA 3.1.1、下载cuda 3.1.2、安装cuda 3.2、安装cudnn 4、配置相关代码的环…

poj 3050

给定一个5*5的地图,每个格子上有一个数字。从一个格子出发(上下左右4个方向),走5步将数字连起来可以构造出一个6位数。问该地图可以构造出多少个不同的6位数。 1.看成不能走已经走过的路了,导致5分钟没有写完代码 &a…

OptiPlex 3050 排除故障诊断和电源 LED 代码

表 1. 电源 LED 状态 电源 LED 指示灯状态可能的原因故障排除步骤关闭表明计算机已关闭、未接通电源或处于休眠模式。 在计算机背面的电源连接器和电源插座处重置电源电缆。如果计算机已连接至配电盘,确保配电盘插入电源插座并且已打开。此外,还可以不经…

【Win11+RTX3050显卡】cuda+cudnn+tensorflow 环境配置

【Win11RTX3050显卡】cudacudnntensorflow 环境配置 CUDA 11.5 cudnn 8.3.3 tensorflow-gpu 2.6 1、名词解释 CUDA:CUDA 即英伟达的显卡并行计算框架 nvidia-smi 可以查看,每个版本的CUDA都是基于一定版本的驱动建立的,所以它对驱动的最低…

selenium clear()无效的解决办法

做自动化时,在往输入框中send_keys前往往需要先清空一下这个输入框里的内容,避免输入框原本有内容或默认值,导致最终输入的结果不是预期的内容。 清空内容我们一般会用clear()方法 import time from selenium import webdriverdriver webd…

GIS在地质灾害危险性评估与灾后重建中的实践

第一章 基本概念与平台介绍 1、基本概念 地质灾害类型 地质灾害发育特征与分布规律 地质灾害危害特征 地质灾害孕灾地质条件分析 地质灾害诱发因素与形成机理 ​ 2、GIS原理与ArcGIS平台介绍 GIS简介 ArcGIS基础 空间数据采集与组织 空间参考 空间数据的转换与处理 …

【VictoriaMetrics】VictoriaMetrics单机版批量和单条数据写入(influx格式)

VictoriaMetrics单机版支持以influx格式的数据写入,写入支持单条数据写入以及多条数据写入,下面操作演示下如何使用 1、首先需要启动VictoriaMetrics单机版服务 启动VictoriaMetrics单机版服务执行的命令如下 nohup /opt/victoriaMetrics/victoria-metrics-prod -httpListe…

记录一下,不是所有的韩语输入法apk,装到同一个系统,都能弹出软键盘

记录一下,不是所有的韩语输入法apk,装到同一个系统,都能弹出软键盘 今天,业务给了一个韩语输入法apk,安装上去,软键盘一直弹不出来,安装在自己手机没问题,安装在公司产品,就有问题。…

android qq输入法表情,QQ输入法如何输入表情

QQ输入法输入表情的方法如下: QQ输入法表情包括QQ经典图片图片表情,特殊符号,及字符表情。 (1)QQ图片表情是一些动态表情图片,如下: (2)特殊符号由12页共16类符号组成,囊括了软键盘全系列符号,此…

企业邮箱保密性评测揭晓:哪个流行的企业邮箱保密性更高?

大多数流行的电子邮件提供商都没有为您的电子邮件提供足够的保护,这已不是什么秘密。在这里我们将了解流行的电子邮件提供商使用的不同类型的加密,以及您如何选择满足您的隐私需求的企业邮箱最佳提供商。 一、谷歌邮箱 默认情况下,Gmail使用T…

服务器维护中韩语怎么说,韩语输入法安装新问题

2005-08-28 如何删处WINDOWS中的日文, 在“Windows\ime\”文件夹保存有输入法相关的文件,其中的繁体中文、日文、韩文输入法对我们大部分人都没有用,我们可将“chtime”、“imjp8_1”、“imkr6_1”三个目录删除,它们分别是繁体中文…

Raspbian上显示韩文并安装韩语输入法

韩文显示 由于初始的Raspbian系统缺少韩文字体,文件名以及网页中的韩文显示成了乱码 sudo apt install fonts-unfonts-core安装韩语输入法 Raspbian上常用谷歌拼音作为中文输入法 sudo apt-get install fcitx fcitx-googlepinyin为了不影响中文输入法的使用&…

内码输入法手机版下载_内码输入法

内码输入法是一款专为window Vista和win7系统打造的输入法程序。内码是指整机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。欢迎下载。 软件说明 内码是指整机汉字系统中使用的…

搜狗输入法精简_搜狗输入法10.10去图标精简版+9.4.21小米定制版

特别声明所有软件皆来源于网上收集整理,仅供学习与交流技术,不得用作其它用途,如有侵犯你的权益,请联系我们,我们将于24小时内进行删除,谢谢你的配合! 1 搜狗输入法,拥有全能输入方式、海量词库与智能预测,致力高效流畅的输入体验,引领亿万用户输入之选。【全能输入】全…

我设计的五笔日本语输入法和韩语输入法初稿图

适合中国人使用的五笔日本語输入法和韩语输入法(한국어)正开始编写中,估计完成需要3~5年的时间。我设计的粤语输入法一直提供免费下载,已经是一套完整的粤语拼音输入法。(更多评论)
最新文章