学习模块

AI-Practices 包含 9 个核心学习模块，采用渐进式课程设计，从基础到进阶系统覆盖 AI 全技术栈。

模块总览

模块	名称	内容概述	Notebooks	难度
01	机器学习基础	线性模型、SVM、决策树、集成学习	25+	⭐⭐
02	神经网络	反向传播、优化器、正则化、自定义层	15+	⭐⭐⭐
03	计算机视觉	CNN 架构、迁移学习、目标检测	20+	⭐⭐⭐
04	序列模型	RNN/LSTM、Attention、Transformer	18+	⭐⭐⭐
05	高级专题	超参优化、分布式训练、模型部署	12+	⭐⭐⭐⭐
06	生成模型	VAE、GAN、Diffusion Models	15+	⭐⭐⭐⭐
07	强化学习	DQN、PPO、SAC、World Models	12+	⭐⭐⭐⭐
08	理论笔记	数学基础、优化理论、信息论	10+	⭐⭐
09	实战项目	Kaggle 竞赛、工业项目	19+	⭐⭐⭐⭐

学习路径推荐

🎯 入门路线 (8-12 周)

适合 AI 初学者，建立扎实基础。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│   01 机器学习基础  ──────►  02 神经网络  ──────►  03 计算机视觉  │
│        (4-6周)              (3-4周)              (3-4周)        │
│                                                                 │
│   学习内容:                                                      │
│   • 线性回归、逻辑回归      • 反向传播原理      • CNN 架构演进    │
│   • SVM、决策树            • 优化器选择        • 迁移学习        │
│   • XGBoost、LightGBM      • 正则化技术        • 数据增强        │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

🚀 进阶路线 (6-10 周)

适合有基础的学习者，掌握前沿技术。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│   04 序列模型  ──────►  05 高级专题  ──────►  06 生成模型        │
│      (3-4周)            (2-3周)              (3-4周)            │
│                              │                                  │
│                              ▼                                  │
│                        07 强化学习                              │
│                           (3-4周)                               │
│                                                                 │
│   学习内容:                                                      │
│   • Transformer 架构        • 超参数优化        • VAE/GAN       │
│   • BERT/GPT 原理          • 模型部署          • Diffusion      │
│   • 注意力机制              • 分布式训练        • DQN/PPO       │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

🏆 实战路线 (持续)

适合准备参加竞赛或工业落地的学习者。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│                      09 实战项目                                │
│                                                                 │
│   ┌─────────────┐  ┌─────────────┐  ┌─────────────┐            │
│   │  ML 基础    │  │  CV 项目    │  │  NLP 项目   │            │
│   │  项目       │  │             │  │             │            │
│   │  • Titanic  │  │  • MNIST    │  │  • 情感分析 │            │
│   │  • Otto     │  │  • CIFAR    │  │  • NER      │            │
│   └─────────────┘  └─────────────┘  └─────────────┘            │
│                                                                 │
│   ┌─────────────────────────────────────────────────┐          │
│   │              Kaggle 竞赛方案                     │          │
│   │  🥇 Feedback Prize - ELL (Top 1%)               │          │
│   │  🥇 RSNA Abdominal Trauma (Top 1%)              │          │
│   │  🥈 American Express Default (Top 5%)           │          │
│   │  🥉 RSNA Lumbar Spine (Top 10%)                 │          │
│   └─────────────────────────────────────────────────┘          │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

各模块详情

📚 01 - 机器学习基础

建立坚实的机器学习理论基础。

子模块	核心算法	关键概念
线性模型	OLS, Ridge, Lasso	正则化, 偏差-方差权衡
分类算法	Logistic, SVM	最大间隔, 核技巧
树模型	CART, RF, GBDT	信息增益, 集成学习
降维聚类	PCA, t-SNE, K-Means	流形学习, 无监督学习

核心公式：

Ridge: min_{θ} ∥ X θ - y ∥^{2} + λ ∥ θ ∥^{2}

🧠 02 - 神经网络

掌握深度学习核心技术。

子模块	技术要点	应用场景
网络基础	前向传播, 反向传播	所有深度学习任务
优化技术	SGD, Adam, AdamW	模型训练加速
正则化	Dropout, BatchNorm	防止过拟合
自定义	自定义层, 损失函数	特殊任务需求

👁️ 03 - 计算机视觉

系统学习 CNN 架构演进。

架构演进时间线：

1998        2012        2014        2015        2019        2020
 │           │           │           │           │           │
 ▼           ▼           ▼           ▼           ▼           ▼
LeNet ──► AlexNet ──► VGG/GoogLeNet ──► ResNet ──► EfficientNet ──► ViT

技术	代表模型	创新点
基础 CNN	LeNet, AlexNet	卷积, 池化
深度网络	VGG, ResNet	残差连接
高效网络	MobileNet, EfficientNet	深度可分离卷积
Vision Transformer	ViT, Swin	自注意力机制

📝 04 - 序列模型

从 RNN 到 Transformer 的演进。

Attention 核心公式：

Attention (Q, K, V) = softmax (\frac{Q K^{T}}{\sqrt{d_{k}}}) V

模型	特点	适用场景
RNN/LSTM	序列建模, 门控机制	短序列任务
Transformer	并行计算, 长距离依赖	NLP, CV
BERT	双向编码, 预训练	文本理解
GPT	自回归, 生成	文本生成

⚡ 05 - 高级专题

工程化与优化技术。

专题	工具/方法	应用
超参优化	Optuna, Ray Tune	自动调参
分布式训练	DDP, FSDP	大规模训练
模型压缩	量化, 剪枝, 蒸馏	边缘部署
部署推理	ONNX, TensorRT	生产环境

🎨 06 - 生成模型

学习生成式 AI 核心技术。

模型	原理	应用
VAE	变分推断, 重参数化	图像生成, 表示学习
GAN	对抗训练, 博弈论	图像生成, 超分辨率
Diffusion	去噪扩散, 分数匹配	DALL-E, Stable Diffusion

🎮 07 - 强化学习

掌握决策与控制算法。

Bellman 方程：

Q^{*} (s, a) = E [r + γ max_{a^{'}} Q^{*} (s^{'}, a^{'})]

方法	代表算法	特点
值方法	DQN, Double DQN	离散动作空间
策略方法	REINFORCE, PPO	连续动作空间
Actor-Critic	A2C, SAC	结合两者优点

技术栈总览

机器学习框架

框架	版本	用途
Scikit-learn	1.3+	传统 ML 算法
XGBoost	2.0+	梯度提升
LightGBM	4.0+	高效 GBDT

深度学习框架

框架	版本	用途
TensorFlow	2.13+	生产部署
PyTorch	2.x	研究开发
Keras	3.x	快速原型
Transformers	4.30+	NLP 预训练模型

数据处理

工具	用途
NumPy / Pandas	数值计算, 数据处理
OpenCV / Pillow	图像处理
NLTK / spaCy	文本处理

开始学习

建议

按照推荐路径循序渐进
每个模块都要动手实践
遇到问题先查阅理论笔记 (08)
学完基础后尽早开始实战项目 (09)

选择你的起点：

🆕 零基础 → 01 - 机器学习基础
📈 有 ML 基础 → 02 - 神经网络
🎯 想做项目 → 09 - 实战项目

学习模块 ​

模块总览 ​

学习路径推荐 ​

🎯 入门路线 (8-12 周) ​

🚀 进阶路线 (6-10 周) ​

🏆 实战路线 (持续) ​

各模块详情 ​

📚 01 - 机器学习基础 ​

🧠 02 - 神经网络 ​

👁️ 03 - 计算机视觉 ​

📝 04 - 序列模型 ​

⚡ 05 - 高级专题 ​

🎨 06 - 生成模型 ​

🎮 07 - 强化学习 ​

技术栈总览 ​

机器学习框架 ​

深度学习框架 ​

数据处理 ​

开始学习 ​