六月二十日夜渡海(苏轼)
参横斗转欲三更,苦雨终风也解晴。 云散月明谁点缀?天容海色本澄清。 空余鲁叟乘桴意,粗识轩辕奏乐声。 九死南荒吾不恨,兹游奇绝冠平生。
ViT(Vision Transformer)笔记 ViT(Vision Transformer)笔记
1. 摘要Transformer 已经是 NLP(自然语言处理)领域的”标配”(如 BERT, GPT 系列), 但在 CV 中长期以”局部改造”的方式出现: 要么与 CNN 组合, 要么在 CNN 中以注意力替换部分卷积, 整体框架仍以卷
DETR(Detection Transformer)笔记 DETR(Detection Transformer)笔记
DETR (Detection Transformer) 1. 摘要把目标检测的任务看成集合预测的问题.DETR 提出了新的目标函数,通过二分图匹配的方式,强制模型输出一组独一无二的预测,理想状态只输出一个框,进一步移除候选框生成与启发式后
MNIST 多层感知机(MLP)分类器代码详解 MNIST 多层感知机(MLP)分类器代码详解
本项目实现了一个基于 PyTorch 的多层感知机(MLP)模型,用于对 MNIST 手写数字图片进行分类.本文将对 mnist_mlp_classifier.py 代码进行逐行详细解析,帮助初学者理解每一步的设计思路,参数设置原因,以及涉
2025-10-13
RNN基础 RNN基础
1. RNN基础概念1.1 什么是循环神经网络循环神经网络(Recurrent Neural Network, RNN)是一类专门处理序列数据的神经网络.与传统的全连接神经网络不同,RNN具有”记忆”能力,能够利用之前的信息来影响当前的输出
2025-10-13
数据结构-绪论 数据结构-绪论
1. 基本概念和术语数据 (Data)定义 | 数据 (Data): 数据是信息的载体, 是描述客观事物属性的数, 字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合. 对于计算机来说, 就是二进制的 0 和 1 数值型数据:
2025-10-11
CNN基础 CNN基础
CNN (Convolutional Neural Network, 卷积神经网络) (基础) 1. 图像基础与本质1.1 图像的输入结构以MNIST数据集为例, 灰度图像的输入尺寸为 1×28×281 \times 28 \times 2
2025-10-01
SMPL基础 SMPL基础
简介SMPL,全称 Skinned Multi-Person Linear Model,是一套优雅而实用的三维人体参数化模型. 更白话一点:给它一份”骨架的姿态”(pose)和”一纸身形的刻度”(shape),它便能织出一张细腻的人体网格(