YOLO算法

image-20260313125802849

YOLO11 网络结构图

image-20260313131301821

image-20260314154046093

image-20260314154734560

YOLO11 中的 CBS 模块 —— 考研复试 / 项目答辩版(直白易懂)

YOLO11 里的 CBS 是核心基础模块,是构成整个网络的「最小单元」,你可以把它理解成 YOLO 系列里 Conv-BN-SiLU 的「三合一封装」。

一、CBS 的全称 & 组成(拆解开就懂)

CBS = Conv(卷积层) + BN(批量归一化) + SiLU(激活函数)

(注:早期 YOLO 版本用 LeakyReLU,YOLOv8/11 统一换成 SiLU,也叫 Swish 激活)

表格

组件 作用
Conv 卷积层 提取特征、调整通道数(比如把 3 通道图片转成 64 通道特征图)
BN 批量归一化 加速训练、防止过拟合、稳定梯度(不用手动调学习率,训练更快)
SiLU 激活函数 引入非线性,让网络能拟合复杂特征(比 ReLU 更平滑,精度更高)

二、CBS 在 YOLO11 里的作用

  1. 特征提取的「第一步」:输入图片后,第一个模块就是 CBS,先把原始图片转成高维特征图;

  2. 轻量化设计:YOLO11 用 CBS 替代了早期复杂的卷积组合,减少参数和计算量,兼顾速度和精度;

  3. 贯穿整个网络:不管是 Backbone(主干网络)、Neck(特征融合)还是 Head(检测头),都用 CBS 作为基础单元,比如:

    • Backbone 里的 C2f 模块,内部是多个 CBS 堆叠;
    • Neck 里的 SPPELAN 模块,入口也是 CBS;
    • 输出层前的特征调整,还是 CBS。

三、CBS 和 YOLO 其他模块的区别(避坑)

  • 别和 C2f 搞混:C2f 是 YOLO11 的核心残差模块,内部包含多个 CBS,是「大模块」;CBS 是「小单元」;
  • 别和 GhostConv 搞混:GhostConv 是轻量化卷积,YOLO11-Ghost 版本会用 GhostConv 替换 CBS 里的普通 Conv,变成「Ghost-CBS」,进一步减少计算量。

四、一句话总结(复试直接说)

YOLO11 的 CBS 模块是 Conv+BN+SiLU 的组合,是网络的基础特征提取单元,负责特征提取、归一化和非线性变换,轻量化且高效,贯穿整个 YOLO11 的主干和 Neck 部分。


总结

  1. CBS 是 YOLO11 基础模块,由卷积、BN、SiLU 组成;
  2. 核心作用是提取特征、加速训练、引入非线性;
  3. 是 C2f/SPPELAN 等大模块的组成单元,是 YOLO11 轻量化的关键。

YOLO11 中 C3k/C3k2 模块 —— 考研

C3k 和 C3k2 是 YOLO11 里替代传统 C3/C2f 的轻量化残差模块,核心作用是在 Backbone(主干网络)中做「特征融合 + 轻量化」,兼顾精度和速度,是 YOLO11 轻量化设计的核心。

一、先搞懂核心逻辑:C3k/C3k2 的本质

C3k/C3k2 都是「C2f 模块的变体」,核心改进是用 k×k 深度可分离卷积 替代传统 3×3 普通卷积,进一步减少参数和计算量,同时保留残差连接的特征融合能力。

表格

模块 核心组成 适用场景
C3k CBS 模块 + k×k 深度可分离卷积 + 残差分支 + 拼接融合 YOLO11 基础版 Backbone
C3k2 双分支 C3k 结构(两个并行的 k×k 深度可分离卷积分支)+ 特征拼接 YOLO11-L/XL 等大模型版本

二、拆解 C3k 模块(最核心)

C3k = CBS(入口) + k×k 深度可分离卷积(核心) + 残差连接 + Concat(拼接)

  1. 入口 CBS:先对输入特征做卷积 + BN+SiLU,调整通道数;

  2. 分支设计

    • 主分支:用 k×k 深度可分离卷积(比如 5×5)提取深层特征(k 是卷积核大小,YOLO11 默认 k=5);
    • 残差分支:直接跳过卷积,保留原始特征(避免梯度消失);
  3. 融合输出:把主分支和残差分支的特征拼接(Concat),再通过 1×1 卷积调整通道数,输出融合后的特征。

三、C3k2 模块:C3k 的「双分支强化版」

C3k2 是 C3k 的升级,核心差异:

  • 把 C3k 的「单 k×k 卷积分支」改成「两个并行的 k×k 卷积分支」(比如一个 3×3、一个 5×5);
  • 两个分支提取不同尺度的特征,再和残差分支拼接融合;
  • 比 C3k 能提取更丰富的多尺度特征,适合大模型(L/XL),小模型(n/s/m)用 C3k 足够。

四、C3k/C3k2 对比传统 C2f 的优势(YOLO11 改进点)

  1. 更轻量化:k×k 深度可分离卷积的计算量只有普通 3×3 卷积的 1/k²,参数减少 50%+;
  2. 多尺度特征:k 可选 3/5/7,能捕捉更大感受野的特征,对中大型目标检测更友好;
  3. 更快的推理速度:在精度几乎不下降的前提下,YOLO11 用 C3k/C3k2 比 YOLOv8 的 C2f 推理速度提升 10%-15%。

五、一句话总结(复试 / 答辩直接说)

YOLO11 的 C3k/C3k2 是轻量化残差模块,C3k 用 k×k 深度可分离卷积替代传统卷积,C3k2 是双分支 C3k,核心是在减少计算量的同时保留多尺度特征融合能力,是 YOLO11 主干网络的核心组件。


总结

  1. C3k/C3k2 是 YOLO11 轻量化残差模块,替代 YOLOv8 的 C2f;
  2. C3k 核心是 k×k 深度可分离卷积 + 残差,C3k2 是双分支 C3k;
  3. 优势:轻量化、多尺度特征、更快推理速度。

image-20260313131425858

Backbone 特征提取

image-20260313131602488

image-20260313132159549

Neck 进行特征融合和增强 + Detect 预测

image-20260313131818804

损失函数

image-20260313155826019