百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

目标检测新框架CBNet | 多Backbone网络结构用于目标检测(附源码下载)

ccwgpt 2024-10-30 01:41 20 浏览 0 评论

点击蓝字


关注我们

关注并星标

从此不迷路

计算机视觉研究院


公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

获取回复【CBNe】即可获取源码


计算机视觉研究院专栏

Column of Computer Vision Institute

在现有的基于CNN的检测器中,骨干网络是基本特征提取的重要组成部分,检测器的性能在很大程度上取决于它。

在今天分享中,作者的目标是通过建立一个更强大的骨干网络,如ResNet和ResNeXt,以获得更好的检测性能。具体来说,提出了一种新的策略,通过相邻骨干之间的复合连接来组装多个相同的骨干,以形成一个更强大的骨干称为复合骨干网络(CBNet)。 通过这种方式,CBNet迭代地将前一个骨干的输出特征,即高级特征,作为输入特征的一部分,以逐阶段的方式提供给后续骨干,最后使用最后一个骨干的特征映射(称为领导骨干)进行目标检测。 最后证明CBNet可以非常容易地集成到大多数先进的检测器中,并显著提高它们的性能。

CBNet通过相邻骨干的并行阶段之间的复合连接组合多个相同的骨干(助理骨干和领导骨干)。通过这种方式,CBNet以一种逐阶段的方式迭代地将骨干的输出特征作为输入特征的一部分反馈给后续骨干,最后输出最后一个骨干的特征,即用于对象检测的领导骨干。红色箭头表示复合连接。

背景

Recurrent Convolution Neural Network:


如上图所示,所提出的复合骨干网络体系结构与未展开的递归卷积神经网络(RCNN)体系结构有点相似。然而,所提出的CBNet与该网络有很大的不同。

首先,如上图所示,CBNet的体系结构实际上是完全不同的,特别是对于并行阶段之间的连接。第二,在RCNN中,不同时间步骤的并行阶段共享参数,而在所提出的CBNet中,骨干的并行阶段不共享参数。

此外,如果我们使用RCNN作为检测器的主干,我们需要在Image Net上对其进行预训练。然而,当我们使用CBNet时,我们不需要对其进行预训练。

Architecture of CBNet

所提出的CBNet的体系结构由K个相同的骨干(K≥2)组成)。特别是,为了简单起见,将K=2的情况(如上图a所示)称为双骨干(DB),K=3的情况称为三骨干(TB)。如下图所示,CBNet体系结构包含两种类型的骨干:领导骨干BK和助理骨干B1、B2、...、BK?1。个骨干包括L级(一般为L级=5级),每个级由几个具有相同大小特征映射的卷积层组成。骨干的第l阶段实现了一个非线性变换Fl(·)

在传统的只有一个骨干的卷积网络中,第l阶段以前一个l?第1阶段的输出(表示为xl?1)作为输入,可以表示为:

CBNet就不完全于此:

此外,CBNet中的B1、B2、...、BK?1可以采用各种骨干结构,并且可以直接从预先训练好的模型中初始化单个骨干。

Other possible composite styles

实验

CBNet (Dual-ResNet101) 与ResNet101可视化比较


COCO数据集上检测器的mAP增加了约1.5%至3%,通过简单地将CBNet集成到Cascade Mask R-CNN基线中,在COCO上获得了一个新的最先进的结果,mAP为53.3。

同时,实验结果表明,提高实例分割性能也是非常有效的。额外的研究进一步证明了所提出的结构和复合连接模块的有效性。


END



转载请联系本公众号获得授权


计算机视觉研究院学习群等你加入!


ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


??




相关推荐

MFC、Qt、WPF?该用哪个?(mfc和wpf区别)

MFC、Qt和WPF都是流行的框架和工具,用于开发图形用户界面(GUI)应用程序。选择哪个框架取决于你的具体需求和偏好。MFC(MicrosoftFoundationClass)是微软提供的框架,...

一款WPF开发的通讯调试神器(支持Modbus RTU、MQTT调试)

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!项目介绍Wu.CommTool是一个基于C#、WPF、Prism、MaterialDesign...

关于面试资深C#、WPF开发工程师的面试流程和问题

一、开场(2-3分钟)1.欢迎应聘者,简单介绍公司和面试流程。2.询问应聘者是否对公司或岗位有初步的问题。二、项目经验与技术应用(10-20分钟)1.让应聘者详细介绍几个他参与过的C#、...

C# WPF MVVM模式Prism框架下事件发布与订阅

01—前言处理同模块不同窗体之间的通信和不同模块之间不同窗体的通信,Prism提供了一种事件机制,可以在应用程序中低耦合的模块之间进行通信,该机制基于事件聚合器服务,允许发布者和订阅者之间通过事件进行...

WPF 机械类组件动画制作流程简述(wps上怎么画机械结构简图)

WPF机械类组件动画制作流程简述独立观察员2025年3月4日一、创建组件创建组件用户控件,将组件的各部分“零件”(图片)拼装在一起,形成组件的默认状态:二、给运动部分加上Rend...

C#上位机WinForm和WPF选哪个?工控老油条的"血泪史"

作为一个从互联网卷进工控坑的"跨界难民",在这会摸鱼的时间咱就扯一下上位机开发选框架这档子破事。当年我抱着WPF的酷炫动画一头扎进车间,结果被产线老师傅一句"你这花里胡哨的玩意...

【一文扫盲】WPF、Winform、Electron有什么区别?

近年来,随着软件开发的不断发展,开发人员面临着选择适合他们项目的各种框架和工具的挑战。在桌面应用程序开发领域,WPF、Winform和Electron是三个备受关注的技术。本文将介绍这三者的区别,帮助...

一个开源、免费、强大且美观的WPF控件库

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!项目介绍HandyControl是一套基于WPF(WindowsPresentationF...

WPF 根据系统主题自动切换浅色与深色模式

WPF根据系统主题自动切换浅色与深色模式控件名:Resources作者:WPFDevelopersOrg-驚鏵原文链接[1]:https://github.com/WPFDevelopers...

WPF与WinForm的本质区别(wpf与maui)

在Windows应用程序开发中,WinForm和WPF是两种主要的技术框架。它们各自有不同的设计理念、渲染机制和开发模式。本文将详细探讨WPF与WinForm的本质区别,并通过示例进行说明。渲染机制W...

Win10/Win11效率神器再进化:微软发布PowerToys 0.90.0版本

IT之家4月1日消息,微软今天(4月1日)更新PowerToys,在最新发布的0.90.0版本中,修复多个BUG之外,引入多项功能更新,为Windows10、Windows...

一款非常漂亮的WPF管理系统(wpf架构及特性)

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!WPFManager项目介绍该项目是一款WPF开发的管理系统,数据库采用的MSSqlserv...

WPF 实现描点导航(wpf按钮的点击事件)

WPF实现描点导航控件名:NavScrollPanel作者:WPFDevelopersOrg-驚鏵原文链接[1]:https://github.com/WPFDevelopersOrg/WPF...

微软更新基于Win11的Validation OS 2504:增强 .NET与WPF

IT之家5月1日消息,科技媒体NeoWin今天(5月1日)发布博文,报道称微软公司更新基于Windows11的ValidationOS,增强支持.NET和WPF,并优...

WPF的技术架构与优势(wpf的前景)

WindowsPresentationFoundation(WPF)是一个现代化的用户界面框架,专为构建Windows应用程序而设计。它通过分层的技术架构和丰富的功能集,提供了全面的应用程...

取消回复欢迎 发表评论: