YOLOv8改进系列,YOLOv8的Neck替换成AFPN(CVPR 2023)

news/2024/9/19 18:57:04 标签: YOLO, 计算机视觉, 目标检测, 人工智能, python

在这里插入图片描述

摘要

多尺度特征在物体检测任务中对编码具有尺度变化的物体非常重要。多尺度特征提取的常见策略是采用经典的自上而下和自下而上的特征金字塔网络。然而,这些方法存在特征信息丢失或退化的问题,影响了非相邻层次的融合效果。一种渐进式特征金字塔网络(AFPN),以支持非相邻层次的直接交互。AFPN通过融合两个相邻的低层特征开始,并渐进地将高层特征纳入融合过程中。通过这种方式,可以避免非相邻层次之间较大的语义差距。鉴于在每个空间位置进行特征融合时可能会出现多对象信息冲突,进一步利用自适应空间融合操作来缓解这些不一致性。

AFPN 介绍

AFPN 在初始阶段融合两个低级特征。随后的阶段融合更高级别的特征,而最后阶段将顶级特征添加到特征融合过程中。黑色箭头代表卷积,青绿色箭头代表自适应空间融合。架构如下图:
在这里插入图片描述
在主干网的自下而上特征提取过程中,AFPN 渐进地集成低层、高层和顶层特征。具体来说,AFPN 最初融合低层特征,然后是深层特征,最后是最顶层特征,即最抽象的特征。非相邻层次特征之间的语义间隙比相邻层次特征之间的语义间隙更大,尤其是底层和顶层特征。因此,直接使用 C2、C3、C4 和 C5 进行特征融合是不合理的。由于 AFPN 的架构是渐进的,这将使不同层次特征在渐进融合过程中语义信息更接近,从而缓解上述问题。例如,C2 和 C3 之间的特征融合减少了它们之间的语义间隙。由于 C3 和 C4 是相邻层次特征,因此 C2 和 C4 之间的语义间隙也减少了。

为了对齐维度并准备特征融合,我们利用 1×1 卷积和双线性插值方法进行特征上采样。另一方面,根据所需的下采样率,使用不同的卷积核和步幅进行下采样。例如,我们应用 2 × 2 卷积,步幅为 2,以实现 2 倍下采样;应用 4 × 4 卷积,步幅为 4,以实现 4 倍下采样;应用 8 × 8 卷积,步幅为 8,以实现 8 倍下采样。在特征融合之后,我们继续使用四个残差单元学习特征,这些残差单元类似于 ResNet ,每个残差单元包括两个 3 × 3 卷积。AFPN 仅引入了普通卷积组件,因此在实际应用中的 AFPN 更为可行和实用。

自适应空间融合操作,如下图所示,展示了在三个不同级别上的特征融合
在这里插入图片描述

理论详解可以参考链接:论文地址
代码可在这个链接找到:


http://www.niftyadmin.cn/n/5665991.html

相关文章

AI问答-HTTP:理解 Content-Disposition

本文背景 在下载arraybuffer文件时,想要获取文件名,这时引入本文内容Content-Disposition,我们在Content-Disposition获取到文件名就可以在下载后的文件以该文件名命名了。 一、简介 Content-Disposition是HTTP协议中的一个响应头字段&…

若依Nodejs后台、实现90%以上接口,附体验地址、源码、拓展特色功能

背景 前端的宝子们代码写累了吗?那就一起研究下后端吧! 体验地址:http://106.54.233.63:5000 Gitee源码:https://gitee.com/ruirui-study/ruoyi_nodejs_open 本项目的前端基于若依Vue3.0版本,后端是基于MidwayJs框…

inBuilder低代码平台新特性推荐-第二十四期

今天给大家带来的是 inBuilder 低代码平台新特性推荐第二十四期 ——表单格式支持流程配置。 场景介绍: 如下图所示,目前支持在流程设计上的不同节点设置表单字段的必填、显隐等属性控制,不必在表单设计上进行配置,从而减少了开…

以电子书号出版的论著可以评职称吗?

以电子书号出版的论著是否可以评职称不能一概而论,需要根据具体的职称评审单位要求来判断。具体情况如下: 专业的论著出版平台,高效的出版流程。从内容优化到市场推广,全方位服务。 1. 可能认可的情况: - 中级职称评…

【机器学习】7 ——k近邻算法

机器学习7——k近邻 输入:实例的特征向量 输出:类别 懒惰学习(lazy learning)的代表算法 文章目录 机器学习7——k近邻1.k近邻2.模型——距离,k,分类规则2.1距离——相似程度的反映2.2 k值分类规则 算法实…

开发定制:学校考试成绩自动处理,可定制规则

需求分析: 教导处在年中或年尾时要对成绩,按一定规则分析处理。都是些重复性工作。所以有必要自动处理。 广告:按规则定制自动处理软件或网页设计。 以下技术栈和步骤: 后端 (Flask): Flask 是一个轻量级的 Python Web 框架&…

监控易监测对象及指标之:全面监控ElasticSearch集群

随着大数据和云计算技术的不断发展,ElasticSearch作为一款基于Lucene的开源搜索引擎,已成为众多企业和组织进行全文搜索、结构化搜索和分析的首选工具。然而,随着ElasticSearch集群规模的不断扩大,如何有效监控其运行状态、确保服…

vue3+ant design vue 中弹窗自定义按钮设置及以冒号为基准布局

1、自定义弹窗按钮&#xff0c;去除取消和确定按钮。&#xff08;网上很多方法都是说通过插槽来实现&#xff0c;但是试了下不生效&#xff0c;那既然插槽不生效的话&#xff0c;干脆直接写按钮就好了&#xff09; <a-modalv-model:open"open"title"人员信息…