Skip to content

学习模块

AI-Practices 包含 9 个核心学习模块,采用渐进式课程设计,从基础到进阶系统覆盖 AI 全技术栈。

模块总览

模块名称内容概述Notebooks难度
01机器学习基础线性模型、SVM、决策树、集成学习25+⭐⭐
02神经网络反向传播、优化器、正则化、自定义层15+⭐⭐⭐
03计算机视觉CNN 架构、迁移学习、目标检测20+⭐⭐⭐
04序列模型RNN/LSTM、Attention、Transformer18+⭐⭐⭐
05高级专题超参优化、分布式训练、模型部署12+⭐⭐⭐⭐
06生成模型VAE、GAN、Diffusion Models15+⭐⭐⭐⭐
07强化学习DQN、PPO、SAC、World Models12+⭐⭐⭐⭐
08理论笔记数学基础、优化理论、信息论10+⭐⭐
09实战项目Kaggle 竞赛、工业项目19+⭐⭐⭐⭐

学习路径推荐

🎯 入门路线 (8-12 周)

适合 AI 初学者,建立扎实基础。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│   01 机器学习基础  ──────►  02 神经网络  ──────►  03 计算机视觉  │
│        (4-6周)              (3-4周)              (3-4周)        │
│                                                                 │
│   学习内容:                                                      │
│   • 线性回归、逻辑回归      • 反向传播原理      • CNN 架构演进    │
│   • SVM、决策树            • 优化器选择        • 迁移学习        │
│   • XGBoost、LightGBM      • 正则化技术        • 数据增强        │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

🚀 进阶路线 (6-10 周)

适合有基础的学习者,掌握前沿技术。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│   04 序列模型  ──────►  05 高级专题  ──────►  06 生成模型        │
│      (3-4周)            (2-3周)              (3-4周)            │
│                              │                                  │
│                              ▼                                  │
│                        07 强化学习                              │
│                           (3-4周)                               │
│                                                                 │
│   学习内容:                                                      │
│   • Transformer 架构        • 超参数优化        • VAE/GAN       │
│   • BERT/GPT 原理          • 模型部署          • Diffusion      │
│   • 注意力机制              • 分布式训练        • DQN/PPO       │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

🏆 实战路线 (持续)

适合准备参加竞赛或工业落地的学习者。

┌─────────────────────────────────────────────────────────────────┐
│                                                                 │
│                      09 实战项目                                │
│                                                                 │
│   ┌─────────────┐  ┌─────────────┐  ┌─────────────┐            │
│   │  ML 基础    │  │  CV 项目    │  │  NLP 项目   │            │
│   │  项目       │  │             │  │             │            │
│   │  • Titanic  │  │  • MNIST    │  │  • 情感分析 │            │
│   │  • Otto     │  │  • CIFAR    │  │  • NER      │            │
│   └─────────────┘  └─────────────┘  └─────────────┘            │
│                                                                 │
│   ┌─────────────────────────────────────────────────┐          │
│   │              Kaggle 竞赛方案                     │          │
│   │  🥇 Feedback Prize - ELL (Top 1%)               │          │
│   │  🥇 RSNA Abdominal Trauma (Top 1%)              │          │
│   │  🥈 American Express Default (Top 5%)           │          │
│   │  🥉 RSNA Lumbar Spine (Top 10%)                 │          │
│   └─────────────────────────────────────────────────┘          │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

各模块详情

📚 01 - 机器学习基础

建立坚实的机器学习理论基础。

子模块核心算法关键概念
线性模型OLS, Ridge, Lasso正则化, 偏差-方差权衡
分类算法Logistic, SVM最大间隔, 核技巧
树模型CART, RF, GBDT信息增益, 集成学习
降维聚类PCA, t-SNE, K-Means流形学习, 无监督学习

核心公式

Ridge: minθXθy2+λθ2

🧠 02 - 神经网络

掌握深度学习核心技术。

子模块技术要点应用场景
网络基础前向传播, 反向传播所有深度学习任务
优化技术SGD, Adam, AdamW模型训练加速
正则化Dropout, BatchNorm防止过拟合
自定义自定义层, 损失函数特殊任务需求

👁️ 03 - 计算机视觉

系统学习 CNN 架构演进。

架构演进时间线

1998        2012        2014        2015        2019        2020
 │           │           │           │           │           │
 ▼           ▼           ▼           ▼           ▼           ▼
LeNet ──► AlexNet ──► VGG/GoogLeNet ──► ResNet ──► EfficientNet ──► ViT
技术代表模型创新点
基础 CNNLeNet, AlexNet卷积, 池化
深度网络VGG, ResNet残差连接
高效网络MobileNet, EfficientNet深度可分离卷积
Vision TransformerViT, Swin自注意力机制

📝 04 - 序列模型

从 RNN 到 Transformer 的演进。

Attention 核心公式

Attention(Q,K,V)=softmax(QKTdk)V
模型特点适用场景
RNN/LSTM序列建模, 门控机制短序列任务
Transformer并行计算, 长距离依赖NLP, CV
BERT双向编码, 预训练文本理解
GPT自回归, 生成文本生成

⚡ 05 - 高级专题

工程化与优化技术。

专题工具/方法应用
超参优化Optuna, Ray Tune自动调参
分布式训练DDP, FSDP大规模训练
模型压缩量化, 剪枝, 蒸馏边缘部署
部署推理ONNX, TensorRT生产环境

🎨 06 - 生成模型

学习生成式 AI 核心技术。

模型原理应用
VAE变分推断, 重参数化图像生成, 表示学习
GAN对抗训练, 博弈论图像生成, 超分辨率
Diffusion去噪扩散, 分数匹配DALL-E, Stable Diffusion

🎮 07 - 强化学习

掌握决策与控制算法。

Bellman 方程

Q(s,a)=E[r+γmaxaQ(s,a)]
方法代表算法特点
值方法DQN, Double DQN离散动作空间
策略方法REINFORCE, PPO连续动作空间
Actor-CriticA2C, SAC结合两者优点

技术栈总览

机器学习框架

框架版本用途
Scikit-learn1.3+传统 ML 算法
XGBoost2.0+梯度提升
LightGBM4.0+高效 GBDT

深度学习框架

框架版本用途
TensorFlow2.13+生产部署
PyTorch2.x研究开发
Keras3.x快速原型
Transformers4.30+NLP 预训练模型

数据处理

工具用途
NumPy / Pandas数值计算, 数据处理
OpenCV / Pillow图像处理
NLTK / spaCy文本处理

开始学习

建议

  1. 按照推荐路径循序渐进
  2. 每个模块都要动手实践
  3. 遇到问题先查阅理论笔记 (08)
  4. 学完基础后尽早开始实战项目 (09)

选择你的起点:

Released under the MIT License.