建立目标检测模型
设计网络模型概要输入: 图片Resize 448 * 448
输出:预测目标上的一个目标/物体
可以借助经典模型的部分框架
例如VGG16(经典模型,按照自己需求舍去图像分类部分)
利用前面的特征提取,舍去后面的分类
目标检测模型架构主干 — 颈部 — 头部
1. Backbone – 主干网络
核心作用:从输入图像中提取多尺度、多层次的特征。
工作方式:
像 CNN、ResNet、VGG、ViT 这类网络,会逐步下采样图像,生成不同分辨率的特征图。
浅层特征保留细节(如边缘、纹理),深层特征保留语义(如物体类别、整体结构)。
类比:相当于人的视觉皮层,先把看到的画面拆解成各种基础视觉元素。
2. Neck – 颈部网络
核心作用:对 Backbone 输出的多尺度特征进行融合与增强,实现多分辨率特征聚合。
工作方式:
常见结构如 FPN、PANet、BiFPN,通过上采样 + 下采样的路径,让不同层级的特征互相传递信息。
解决 “小物体特征太弱、大物体特征太粗” 的问题,让每个尺度的特征都包含丰富的上下文信息。
类比:相当于人的视觉中枢,把零散 ...
考研英语口语
1.自我介绍问题:Please introduce yourself in English. / Please introduce yourself. / Give
a brief self-introduction.
• Please introduce your undergraduate school in English.
• Introduce your hometown.
• Please introduce your family situation. / Please introduce your
family/friend/college.
模板:Good morning/aftertoon, professors. My name is Sun Zhicheng. I come from Tai’an and I graduated from Yantai Institute of Technology, majoring in Computer Science and Technology. During ...
YOLO11 目标检测
YOLO算法
YOLO11 网络结构图
YOLO11 中的 CBS 模块 —— 考研复试 / 项目答辩版(直白易懂)YOLO11 里的 CBS 是核心基础模块,是构成整个网络的「最小单元」,你可以把它理解成 YOLO 系列里 Conv-BN-SiLU 的「三合一封装」。
一、CBS 的全称 & 组成(拆解开就懂)CBS = Conv(卷积层) + BN(批量归一化) + SiLU(激活函数)
(注:早期 YOLO 版本用 LeakyReLU,YOLOv8/11 统一换成 SiLU,也叫 Swish 激活)
表格
组件
作用
Conv 卷积层
提取特征、调整通道数(比如把 3 通道图片转成 64 通道特征图)
BN 批量归一化
加速训练、防止过拟合、稳定梯度(不用手动调学习率,训练更快)
SiLU 激活函数
引入非线性,让网络能拟合复杂特征(比 ReLU 更平滑,精度更高)
二、CBS 在 YOLO11 里的作用
特征提取的「第一步」:输入图片后,第一个模块就是 CBS,先把原始图片转成高维特征图;
轻量化设计:YOLO ...
CNN 卷积神经网络 —— 极简核心版
我用最通俗、不绕弯、适合考研复试的方式给你讲 CNN,一遍就能听懂、能复述。
CNN 卷积神经网络 —— 极简核心版CNN 就是专门处理图片(网格数据)的神经网络,
核心思想:局部连接 + 权值共享 + 下采样
一、CNN 最核心的 3 层(必背)1. 卷积层(Convolution)
作用:提取特征(边缘、纹理、形状、高级语义)
工具:卷积核(滤波器)
原理:
用一个小窗口在图片上滑
做点积运算
得到特征图(feature map)
两个大招:
局部连接:只看附近像素,不是全连接
权值共享:一个卷积核整张图用,参数巨少
2. 池化层(Pooling)
作用:降维、压缩、保留关键信息
常见两种:
最大池化(Max Pooling):取区域里最大的值
平均池化(Avg Pooling):取平均
好处:
减小计算量
防止过拟合
让特征更鲁棒
3. 全连接层(FC)
作用:把特征拼成分类结果
把前面的特征图拉平 → 变成向量 → 输出类别概率
二、完整 CNN 结构长这样(标准套路)123456789101112131415输入图像 ↓卷积层 Co ...
1
测试
远程服务器免密登录
配置hexo部署需要的客户端免密登录在本地默认用户的根目录下执行
12# 一路回车就行ssh-keygen -t rsa -C "xxxxxx@qq.com"
之后把本地的公钥文件复制到远程服务器
ps:想免密哪个用户就选哪个用户
12ssh-copy-id -i ~/.ssh/id_rsa.pub 远程用户名@ip地址# 提示输入密码
看到这个提示就成功了
接着直接免密登录
1ssh 免密用户名@ip地址
成功!!
深度学习
深度学习简介一、核心背景(顶层红色文字)“机器学习在处理图像和文本数据方面,能力较弱”
这是整个知识点的前提:传统机器学习(如逻辑回归、SVM、随机森林)擅长处理结构化数据(如表格、数值),但对非结构化数据 (多维)(图像、文本、语音)的特征提取能力不足 —— 无法自动捕捉图像的边缘 / 纹理、文本的上下文语义,因此需要专门的深度学习模型来解决。
二、两大核心解决方案(架构对应与分工)图片通过绿色箭头,将两种非结构化数据与对应的神经网络一一匹配,实现了 “问题 - 解法” 的精准对应:
表格
数据类型
对应模型
英文全称
核心定位
图像
CNN(卷积神经网络)
Convolutional Neural Network
专攻空间特征提取(如图像的形状、颜色、局部纹理)
文本
RNN(循环神经网络)
Recurrent Neural Network
专攻时序特征提取(如文本的上下文顺序、语义关联)
三、模型核心结构(技术底层)两种网络的核心层分工明确,分别适配对应数据的特性:
CNN 的核心层
卷积层:核心层,通过卷积核滑动提取图像的局部特征(如边缘、 ...
爬虫基础01
爬虫基础011.引入requests爬虫基础阶段最重要的包。
1import requests
2.使用requests访问目标网址以爬取豆瓣为例。
get方法里面有三个参数,分别为 url、请求头、请求参数。
1234567891011121314151617url = 'https://m.douban.com/rexxar/api/v2/movie/recommend'# 请求头my_headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36', 'Referer': 'https://movie.douban.com/explore',}# GET 查询参数my_params = { 'star ...
axios调用文心一言API
请求格式1234567891011121314151617181920const accessToken = "xxxxxx";const url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro?access_token=" + accessToken;const headers = {headers: {'Content-Type': 'application/json'}} const params = JSON.stringify({ 'messages': [ {"role": "user", "content": "你好呀!"}, ] });axios.post(url, p ...
毕设项目01--项目搭建
1.项目配置文件项目主Application编写
1234567891011121314151617181920212223package com.javawiki.wiki_02;import org.slf4j.Logger;import org.slf4j.LoggerFactory;import org.springframework.boot.SpringApplication;import org.springframework.boot.autoconfigure.SpringBootApplication;import org.springframework.core.env.Environment;@SpringBootApplicationpublic class Wiki02Application { private static final Logger LOG = LoggerFactory.getLogger(Wiki02Application.class); public static void main(String[] args) ...




