人工智能深度学习系统班6期 14 对比学习与多模态任务实战
- 01 对比学习算法与实例
- 01 对比学习算法与实例
- 02 CLIP系列
- 01 CLIP系列
- 03 多模态3D目标检测算法源码解读
- 01 环境配置与数据集概述
- 02 数据与标注文件介绍
- 03 基本流程梳理并进入debug模式
- 04 数据与图像特征提取模块
- 05 体素索引位置获取
- 06 体素特征提取方法解读
- 07 体素特征计算方法分析
- 08 全局体素特征提取
- 09 多模态特征融合
- 10 3D卷积特征融合
- 11 输出层预测结果
- 04 多模态文字识别
- 01 多模态文字识别
- 05 ANINET源码解读
- 01 数据集与环境概述
- 02 配置文件修改方法
- 03 Bakbone模块得到特征
- 04 视觉Transformer模块的作用
- 05 视觉模型中的编码与解码的效果
- 06 文本模型中的结构分析
- 07 迭代修正模块
- 08 输出层与损失计算