博客
关于我
yolov5数据集制作 数据集分割+voc格式转txt格式代码
阅读量:500 次
发布时间:2019-03-07

本文共 621 字,大约阅读时间需要 2 分钟。

以下是优化后的内容:

在数据集的准备工作中,首先需要对源文件夹中的图片和标签文件进行 randomness分割。通过随机 Shuffle 文件名列表,可以平衡不同样本的下 Αγγ男人属性,从而确保训练集、验证集和测试集的比例分别为0.6:0.2:0.2。整个过程包括以下几个步骤:

  • 定义源文件夹路径,并获取文件名列表。
  • Shuffle 文件列表,以便随机分配样本。
  • 按照预定比例,依次将文件移动到对应的训练集、验证集或测试集目录中。
  • 对于重名文件,建议在目标文件夹中重命名,避免文件覆盖问题。
  • 值得注意的是,如果需要移除验证集或测试集的分割逻辑,只需去掉对应的while循环即可。另外,跨磁盘移动文件时,需要确保源文件夹和目标文件夹在同一磁盘上,这样可以避免文件移动失败的问题。

    接下来,关于VOC标签转换为txt格式的代码转换过程如下:

  • 使用ET库解析XML文件。
  • 提取图像尺寸信息和对象信息。
  • 将标签替换为类别序号,并将坐标转换为目标检测模型(如YOLO)所需的格式。
  • 将最终输出写入txt文件中。
  • 在操作过程中,需要注意以下几点:

  • 确保类别列表包含所有需要检测的类别,否则转换后的txt文件可能会出现空白情况。
  • 如果图像尺寸较大或标签存在问题,需要在转换过程中添加必要的校验逻辑。
  • 通过以上方法,不仅可以完成数据集的准备工作,还可以确保数据格式的统一性,为后续的目标检测任务奠定基础。整个流程需要结合实际项目需求进行调整,确保处理得当。

    转载地址:http://sqijz.baihongyu.com/

    你可能感兴趣的文章
    linux 下使用isign 签名ipa包
    查看>>
    Linux 命令大全
    查看>>
    Linux 学习总结(85)—— 后端开发人员需要知道的 Linux 服务器性能指标总结
    查看>>
    linux 安装mysql8.0.x
    查看>>
    linux 安装oracle_详解windows和Linux校验Oracle数据库安装包的完整性
    查看>>
    Linux 常用命令之cat、tac、nl
    查看>>
    Linux 强大的网络命令:nc,网络的瑞士军刀!
    查看>>
    Linux 显示磁盘空间使用情况的命令:df
    查看>>
    linux 根目录扩容
    查看>>
    Linux 环境下将 ASM 磁盘映射到物理磁盘的完整指南
    查看>>
    Linux 磁盘和文件系统管理2
    查看>>
    Linux 系统备份与恢复详解
    查看>>
    linux 系统服务管理
    查看>>
    Linux 解决E: Sub-process /usr/bin/dpkg returned an error code (1)错误
    查看>>
    linux 解压tar包
    查看>>
    Linux 计划任务详解
    查看>>
    linux 让php支持mysql_转 linux下php扩展mysqli的支持
    查看>>
    linux 访问mysql
    查看>>
    linux 超好用的命令行工具
    查看>>
    Linux 软件 RAID 设置
    查看>>