人工智能深度学习系统班6期 04 MMLAB实战系列
- 01 MMCV安装方法
- 01 MMCV安装方法
- 02 第一模块:分类任务基本操作
- 01 MMCLS问题修正
- 02 准备MMCLS项目
- 03 基本参数配置解读
- 04 各模块配置文件组成
- 05 生成完整配置文件
- 06 根据文件夹定义数据集
- 07 构建自己的数据集
- 08 训练自己的任务
- 03 第一模块:训练结果测试与验证
- 01 测试DEMO效果
- 02 测试评估模型效果
- 03 MMCLS中增加一个新的模块
- 04 修改配置文件中的参数
- 05 数据增强流程可视化展示
- 06 Grad-Cam可视化方法
- 07 可视化细节与效果分析
- 08 MMCLS可视化模块应用
- 09 模型分析脚本使用
- 04 第一模块:模型源码DEBUG演示
- 01 VIT任务概述
- 02 数据增强模块概述分析
- 03 PatchEmbedding层
- 04 前向传播基本模块
- 05 CLS与输出模块
- 05 第二模块:使用分割模块训练自己的数据集
- 01 项目配置基本介绍
- 02 数据集标注与制作方法
- 03 根据预测类别数修改配置文件
- 04 加载预训练模型开始训练
- 05 预测DEMO演示
- 06 第二模块:基于Unet进行各种策略修改
- 01 配置文件解读
- 02 编码层模块
- 03 上采样与输出层
- 04 辅助层的作用
- 05 给Unet添加一个neck层
- 06 如何修改参数适配网络结构
- 07 将Unet特征提取模块替换成transformer
- 08 VIT模块源码分析
- 07 第二模块:分割任务CVPR最新Backbone设计及其应用
- 01 注册自己的Backbone模块
- 02 配置文件指定
- 03 DEBUG解读Backbone设计
- 04 PatchEmbedding的作用与实现
- 05 卷积位置编码计算方法
- 06 近似Attention模块实现
- 07 完成特征提取与融合模块
- 08 分割输出模块
- 09 全局特征的作用与实现
- 10 汇总多层级特征进行输出
- 08 第三模块:mmdet训练自己的数据任务
- 01 数据集标注与标签获取
- 02 COCO数据标注格式
- 03 通过脚本生成COCO数据格式
- 04 配置文件数据增强策略分析
- 05 训练所需配置说明
- 06 模型训练与DEMO演示
- 07 模型测试与可视化分析模块
- 09 第三模块:DeformableDetr物体检测源码分析
- 01 特征提取与位置编码
- 02 序列特征展开并叠加
- 03 得到相对位置点编码
- 04 准备Encoder编码层所需全部输入
- 05 编码层中的序列分析
- 06 偏移量offset计算
- 07 偏移量对齐操作
- 08 Encoder层完成特征对齐
- 09 Decoder要完成的操作
- 10 分类与回归输出模块
- 11 预测输出结果与标签匹配模块
- 10 补充:Mask2former源码解读
- 01 Backbone获取多层级特征
- 02 多层级采样点初始化构建
- 03 多层级输入特征序列创建方法
- 04 偏移量与权重计算并转换
- 05 Encoder特征构建方法实例
- 06 query要预测的任务解读
- 07 Decoder中的AttentionMask方法
- 08 损失模块输入参数分析
- 09 标签分配策略解读
- 10 正样本筛选损失计算
- 11 标签分类匹配结果分析
- 12 最终损失计算流程
- 13 汇总所有损失完成迭代
- 11 第三模块:DeformableDetr算法解读
- 01 DeformableDetr算法解读
- 12 KIE关键信息抽取与视频超分辨率重构
- 01 KIE关键信息抽取与视频超分辨率重构
- 13 第四模块:DBNET文字检测
- 01 文字检测数据概述与配置文件
- 02 配置文件参数设置
- 03 Neck层特征组合
- 04 损失函数模块概述
- 05 损失计算方法
- 14 第四模块:ANINET文字识别
- 01 数据集与环境概述
- 02 配置文件修改方法
- 03 Bakbone模块得到特征
- 04 视觉Transformer模块的作用
- 05 视觉模型中的编码与解码的效果
- 06 文本模型中的结构分析
- 07 迭代修正模块
- 08 输出层与损失计算
- 15 第四模块:KIE基于图模型的关键信息抽取
- 01 配置文件以及要完成的任务解读
- 02 KIE数据集格式调整方法
- 03 配置文件与标签要进行处理操作
- 04 边框要计算的特征分析
- 05 标签数据处理与关系特征提取
- 06 特征合并处理
- 07 准备拼接边与点特征
- 08 整合得到图模型输入特征
- 16 第五模块:stylegan2源码解读
- 01 要完成的任务与基本思想概述
- 02 得到style特征编码
- 03 特征编码风格拼接
- 04 基础风格特征卷积模块
- 05 上采样得到输出结果
- 06 损失函数概述
- 17 第六模块:BasicVSR++视频超分辨重构源码解读
- 01 要完成的任务分析与配置文件
- 02 特征基础提取模块
- 03 光流估计网络模块
- 04 基于光流完成对齐操作
- 05 偏移量计算方法
- 06 双向计算特征对齐
- 07 提特征传递流程分析
- 08 序列传播计算
- 09 准备变形卷积模块的输入
- 10 传播流程整体完成一圈
- 11 完成输出结果
- 18 第七模块:多模态3D目标检测算法源码解读
- 01 环境配置与数据集概述
- 02 数据与标注文件介绍
- 03 基本流程梳理并进入debug模式
- 04 数据与图像特征提取模块
- 05 体素索引位置获取
- 06 体素特征提取方法解读
- 07 体素特征计算方法分析
- 08 全局体素特征提取
- 09 多模态特征融合
- 10 3D卷积特征融合
- 11 输出层预测结果
- 19 第八模块:模型蒸馏应用实例
- 01 任务概述与工具使用
- 02 Teacher与Student网络结构定义
- 03 训练T与S得到蒸馏模型
- 04 开始模型训练过程与问题修正
- 05 日志输出与模型分离
- 06 分别得到Teacher与Student模型
- 07 实际测试效果演示
- 20 第八模块:模型剪枝方法概述分析
- 01 SuperNet网络结构分析与剪枝概述
- 02 搜索匹配到符合计算量的模型并训练
- 21 第九模块:mmaction行为识别
- 01 创建自己的行为识别标注数据集
- 22 OCR算法解读
- 01 OCR算法解读
- 23 额外补充-在源码中加入各种注意力机制方法
- 01 在源码中加入各种注意力机制方法