摘要
在本文中,我们成功应用蒸馏策略以实现YoloV8小模型的无损性能提升。我们采用了MimicLoss作为蒸馏方法的核心,通过对比在线和离线两种蒸馏方式,我们发现离线蒸馏在效果上更为出色。因此,为了方便广大读者和研究者应用,本文所描述的蒸馏方法仅保留了离线蒸馏方案。此外,我们还提供了相关论文的译文,旨在帮助大家更深入地理解蒸馏方法的原理和应用。
YOLOv8n summary (fused): 168 layers, 3011888 parameters, 0 gradients, 8.1 GFLOPsClass     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  5.86it/s]all        230       1412      0.859      0.818      0.884      0.591c17        230        131      0.905      0.924      0.971      0.755c5        230         68      0.903      0.882      0.965      0.745helicopter        230         43      0.877       0.86      0.879      0.521c130        230         85      0.874      0.896      0.952      0.615f16        230         57      0.715      0.842      0.902      0.555b2        230          2          1      0.577      0.995      0.373other        230         86      0.332      0.895      0.785      0.381b52        230         70      0.865      0.971      0.971      0.788kc10        230         62      0.953      0.968      0.982      0.768command        230         40      0.843      0.975      0.968      0.726f15        230        123      0.927      0.854      0.931      0.599kc135        230         91      0.867      0.912      0.956      0.624a10        230         27       0.87      0.519      0.777      0.259b1        230         20      0.868       0.85      0.934      0.569aew        230         25      0.847          1      0.972      0.744f22        230         17      0.698      0.953      0.812      0.579p3        230        105      0.993      0.962       0.99      0.756p8        230          1      0.695          1      0.995      0.597f35        230         32      0.879      0.455      0.789      0.388f18        230        125      0.979      0.976       0.99      0.769v22        230         41      0.907      0.927      0.967      0.599su-27        230         31      0.899      0.968      0.984      0.748il-38        230         27      0.853      0.963      0.958      0.691tu-134        230          1          1          0      0.332      0.265su-33        230          2          1          0      0.117      0.062an-70        230          2      0.717          1      0.995      0.796tu-22        230         98      0.927      0.969      0.986      0.681
Speed: 0.2ms preprocess, 1.6ms inference, 0.0ms loss, 1.4ms postprocess per image