博客
关于我
yolov5数据集制作 数据集分割+voc格式转txt格式代码
阅读量:500 次
发布时间:2019-03-07

本文共 621 字,大约阅读时间需要 2 分钟。

以下是优化后的内容:

在数据集的准备工作中,首先需要对源文件夹中的图片和标签文件进行 randomness分割。通过随机 Shuffle 文件名列表,可以平衡不同样本的下 Αγγ男人属性,从而确保训练集、验证集和测试集的比例分别为0.6:0.2:0.2。整个过程包括以下几个步骤:

  • 定义源文件夹路径,并获取文件名列表。
  • Shuffle 文件列表,以便随机分配样本。
  • 按照预定比例,依次将文件移动到对应的训练集、验证集或测试集目录中。
  • 对于重名文件,建议在目标文件夹中重命名,避免文件覆盖问题。
  • 值得注意的是,如果需要移除验证集或测试集的分割逻辑,只需去掉对应的while循环即可。另外,跨磁盘移动文件时,需要确保源文件夹和目标文件夹在同一磁盘上,这样可以避免文件移动失败的问题。

    接下来,关于VOC标签转换为txt格式的代码转换过程如下:

  • 使用ET库解析XML文件。
  • 提取图像尺寸信息和对象信息。
  • 将标签替换为类别序号,并将坐标转换为目标检测模型(如YOLO)所需的格式。
  • 将最终输出写入txt文件中。
  • 在操作过程中,需要注意以下几点:

  • 确保类别列表包含所有需要检测的类别,否则转换后的txt文件可能会出现空白情况。
  • 如果图像尺寸较大或标签存在问题,需要在转换过程中添加必要的校验逻辑。
  • 通过以上方法,不仅可以完成数据集的准备工作,还可以确保数据格式的统一性,为后续的目标检测任务奠定基础。整个流程需要结合实际项目需求进行调整,确保处理得当。

    转载地址:http://sqijz.baihongyu.com/

    你可能感兴趣的文章
    linux删除卸载npm,卸载安装node npm (Mac linux )
    查看>>
    linux删除路由
    查看>>
    linux加载动态库.so的3种方法
    查看>>
    linux卸载node
    查看>>
    linux卸载python模块_以Linux为平台在Python中删除文件和目录(文件夹)的方法
    查看>>
    Linux卸载和安装mysql:yum方式安装
    查看>>
    Linux卸载和安装yum
    查看>>
    linux卸载软件
    查看>>
    Linux压缩和归档命令的速查表
    查看>>
    Linux压缩和打包
    查看>>
    linux压缩和解压缩命令
    查看>>
    linux压缩解压缩命令:gzip、tar、zip、bzip2
    查看>>
    linux双机热备 oracle,oracle for linux双机热备实战
    查看>>
    Linux发展史:带你穿越技术的时光隧道
    查看>>
    Linux发行版三巨头,你会选择哪一个?
    查看>>
    Linux句柄数过多问题排查
    查看>>
    linux后台启动seata,yearning
    查看>>
    linux启动后执行脚本(/etc/rc.local文件)
    查看>>
    linux命令
    查看>>
    linux命令之rsync同步速度分析
    查看>>