YOLO11 目标检测
YOLO算法

YOLO11 网络结构图



YOLO11 中的 CBS 模块 —— 考研复试 / 项目答辩版(直白易懂)
YOLO11 里的 CBS 是核心基础模块,是构成整个网络的「最小单元」,你可以把它理解成 YOLO 系列里 Conv-BN-SiLU 的「三合一封装」。
一、CBS 的全称 & 组成(拆解开就懂)
CBS = Conv(卷积层) + BN(批量归一化) + SiLU(激活函数)
(注:早期 YOLO 版本用 LeakyReLU,YOLOv8/11 统一换成 SiLU,也叫 Swish 激活)
表格
| 组件 | 作用 |
|---|---|
| Conv 卷积层 | 提取特征、调整通道数(比如把 3 通道图片转成 64 通道特征图) |
| BN 批量归一化 | 加速训练、防止过拟合、稳定梯度(不用手动调学习率,训练更快) |
| SiLU 激活函数 | 引入非线性,让网络能拟合复杂特征(比 ReLU 更平滑,精度更高) |
二、CBS 在 YOLO11 里的作用
特征提取的「第一步」:输入图片后,第一个模块就是 CBS,先把原始图片转成高维特征图;
轻量化设计:YOLO11 用 CBS 替代了早期复杂的卷积组合,减少参数和计算量,兼顾速度和精度;
贯穿整个网络:不管是 Backbone(主干网络)、Neck(特征融合)还是 Head(检测头),都用 CBS 作为基础单元,比如:
- Backbone 里的 C2f 模块,内部是多个 CBS 堆叠;
- Neck 里的 SPPELAN 模块,入口也是 CBS;
- 输出层前的特征调整,还是 CBS。
三、CBS 和 YOLO 其他模块的区别(避坑)
- 别和 C2f 搞混:C2f 是 YOLO11 的核心残差模块,内部包含多个 CBS,是「大模块」;CBS 是「小单元」;
- 别和 GhostConv 搞混:GhostConv 是轻量化卷积,YOLO11-Ghost 版本会用 GhostConv 替换 CBS 里的普通 Conv,变成「Ghost-CBS」,进一步减少计算量。
四、一句话总结(复试直接说)
YOLO11 的 CBS 模块是 Conv+BN+SiLU 的组合,是网络的基础特征提取单元,负责特征提取、归一化和非线性变换,轻量化且高效,贯穿整个 YOLO11 的主干和 Neck 部分。
总结
- CBS 是 YOLO11 基础模块,由卷积、BN、SiLU 组成;
- 核心作用是提取特征、加速训练、引入非线性;
- 是 C2f/SPPELAN 等大模块的组成单元,是 YOLO11 轻量化的关键。
YOLO11 中 C3k/C3k2 模块 —— 考研
C3k 和 C3k2 是 YOLO11 里替代传统 C3/C2f 的轻量化残差模块,核心作用是在 Backbone(主干网络)中做「特征融合 + 轻量化」,兼顾精度和速度,是 YOLO11 轻量化设计的核心。
一、先搞懂核心逻辑:C3k/C3k2 的本质
C3k/C3k2 都是「C2f 模块的变体」,核心改进是用 k×k 深度可分离卷积 替代传统 3×3 普通卷积,进一步减少参数和计算量,同时保留残差连接的特征融合能力。
表格
| 模块 | 核心组成 | 适用场景 |
|---|---|---|
| C3k | CBS 模块 + k×k 深度可分离卷积 + 残差分支 + 拼接融合 | YOLO11 基础版 Backbone |
| C3k2 | 双分支 C3k 结构(两个并行的 k×k 深度可分离卷积分支)+ 特征拼接 | YOLO11-L/XL 等大模型版本 |
二、拆解 C3k 模块(最核心)
C3k = CBS(入口) + k×k 深度可分离卷积(核心) + 残差连接 + Concat(拼接)
入口 CBS:先对输入特征做卷积 + BN+SiLU,调整通道数;
分支设计:
- 主分支:用 k×k 深度可分离卷积(比如 5×5)提取深层特征(k 是卷积核大小,YOLO11 默认 k=5);
- 残差分支:直接跳过卷积,保留原始特征(避免梯度消失);
融合输出:把主分支和残差分支的特征拼接(Concat),再通过 1×1 卷积调整通道数,输出融合后的特征。
三、C3k2 模块:C3k 的「双分支强化版」
C3k2 是 C3k 的升级,核心差异:
- 把 C3k 的「单 k×k 卷积分支」改成「两个并行的 k×k 卷积分支」(比如一个 3×3、一个 5×5);
- 两个分支提取不同尺度的特征,再和残差分支拼接融合;
- 比 C3k 能提取更丰富的多尺度特征,适合大模型(L/XL),小模型(n/s/m)用 C3k 足够。
四、C3k/C3k2 对比传统 C2f 的优势(YOLO11 改进点)
- 更轻量化:k×k 深度可分离卷积的计算量只有普通 3×3 卷积的 1/k²,参数减少 50%+;
- 多尺度特征:k 可选 3/5/7,能捕捉更大感受野的特征,对中大型目标检测更友好;
- 更快的推理速度:在精度几乎不下降的前提下,YOLO11 用 C3k/C3k2 比 YOLOv8 的 C2f 推理速度提升 10%-15%。
五、一句话总结(复试 / 答辩直接说)
YOLO11 的 C3k/C3k2 是轻量化残差模块,C3k 用 k×k 深度可分离卷积替代传统卷积,C3k2 是双分支 C3k,核心是在减少计算量的同时保留多尺度特征融合能力,是 YOLO11 主干网络的核心组件。
总结
- C3k/C3k2 是 YOLO11 轻量化残差模块,替代 YOLOv8 的 C2f;
- C3k 核心是 k×k 深度可分离卷积 + 残差,C3k2 是双分支 C3k;
- 优势:轻量化、多尺度特征、更快推理速度。

Backbone 特征提取


Neck 进行特征融合和增强 + Detect 预测

损失函数




