Stay hungry, stay foolish
ViT(Vision Transformer)笔记 ViT(Vision Transformer)笔记
1. 摘要Transformer 已经是 NLP(自然语言处理)领域的”标配”(如 BERT, GPT 系列), 但在 CV 中长期以”局部改造”的方式出现: 要么与 CNN 组合, 要么在 CNN 中以注意力替换部分卷积, 整体框架仍以卷
DETR(Detection Transformer)笔记 DETR(Detection Transformer)笔记
DETR (Detection Transformer) 1. 摘要把目标检测的任务看成集合预测的问题.DETR 提出了新的目标函数,通过二分图匹配的方式,强制模型输出一组独一无二的预测,理想状态只输出一个框,进一步移除候选框生成与启发式后
SMPL基础 SMPL基础
简介SMPL,全称 Skinned Multi-Person Linear Model,是一套优雅而实用的三维人体参数化模型. 更白话一点:给它一份”骨架的姿态”(pose)和”一纸身形的刻度”(shape),它便能织出一张细腻的人体网格(