DataWhale AI夏令营 2024大运河杯-数据开发应用创新赛
- YOLO(You Only Look Once)
- 上分心得分享
YOLO(You Only Look Once)
YOLO算的上是近几年最火的目标检测模型了,被广泛的应用在工业、学术等领域。
YOLOv1(You Only Look Once 第一版)于 2016年 由 Joseph Redmon 等人在其论文《You Only Look Once: Unified, Real-Time Object Detection》中首次发布。后经历了两次迭代,到yolov3凭借其快速准确的优势迅速统治目标检测领域,后来好像是美军把他的模型应用到武器方面,作者宣布不在迭代新的版本。后续v4一直到目前的V10都是学术界和工业界的一些大佬不断的更新。
在yolo众多版本由Ultralytics公司推出的yoloV5和yoloV8是目前应用较为广泛的两个版本,本次baseline中使用的也是yoloV8模型来进行训练和推理.
yoloV8模型结构如下图。
yolov8的Backbone同样使用CSP网络结构,与yolov5最大区别是,yolov8使用c2f模块代替c3模块。极大的降低了模型的计算了同时也让模型能手链的更迅速。
在neck层依旧采用了经典的PANnet结构。
上分心得分享
先说一下这几天跑下来个人感觉吧,就是数据太差了,细致观察数据可以发现主办方给出标注数据的视频大多都是同一个场景,我甚至看到两个黄色共享电动车的出现在2/5的数据里面也就是50个视频20个有这俩哥们(我自己标了一遍数据,现在看到共享电动我都反胃)。
然后观察测试集你也会发现测试集的视频大多场景信息较为丰富,而训练集这个质量训练出来的数据不用想必然过拟合,即使你map值在高也不会有好的结果。
所以,初赛的上分思路截止到目前不建议大家去更换模型修改模型了就,没什么意义,因为数据决定了你80%的成功。对于数据方面如果大家真的想卷排名:
- 建议自己补充去网上找些公开的数据,自己标注然后补充到里面。
- 然后,还有就是把主办方提供的训练集未标注的数据切帧标注一下,不用很多一个视频几张图片就是,不然标的你迷糊,可能一天什么都干不了就是标数据了,而且主办方大大给的数据,真的不敢恭维,唉!
这个就是目前我自己的思路吧,也提供给大家初赛只能做这些了,而且你数据量数据种类收集起来了后面复赛想拿名次的话也容易,好了“一年一度的数据收集与标注大赛”开始。(!!!切记不要糊涂啊,别给人家测试集标了,取消成绩可没必要)