学习模块
AI-Practices 包含 9 个核心学习模块,采用渐进式课程设计,从基础到进阶系统覆盖 AI 全技术栈。
模块总览
| 模块 | 名称 | 内容概述 | Notebooks | 难度 |
|---|---|---|---|---|
| 01 | 机器学习基础 | 线性模型、SVM、决策树、集成学习 | 25+ | ⭐⭐ |
| 02 | 神经网络 | 反向传播、优化器、正则化、自定义层 | 15+ | ⭐⭐⭐ |
| 03 | 计算机视觉 | CNN 架构、迁移学习、目标检测 | 20+ | ⭐⭐⭐ |
| 04 | 序列模型 | RNN/LSTM、Attention、Transformer | 18+ | ⭐⭐⭐ |
| 05 | 高级专题 | 超参优化、分布式训练、模型部署 | 12+ | ⭐⭐⭐⭐ |
| 06 | 生成模型 | VAE、GAN、Diffusion Models | 15+ | ⭐⭐⭐⭐ |
| 07 | 强化学习 | DQN、PPO、SAC、World Models | 12+ | ⭐⭐⭐⭐ |
| 08 | 理论笔记 | 数学基础、优化理论、信息论 | 10+ | ⭐⭐ |
| 09 | 实战项目 | Kaggle 竞赛、工业项目 | 19+ | ⭐⭐⭐⭐ |
学习路径推荐
🎯 入门路线 (8-12 周)
适合 AI 初学者,建立扎实基础。
┌─────────────────────────────────────────────────────────────────┐
│ │
│ 01 机器学习基础 ──────► 02 神经网络 ──────► 03 计算机视觉 │
│ (4-6周) (3-4周) (3-4周) │
│ │
│ 学习内容: │
│ • 线性回归、逻辑回归 • 反向传播原理 • CNN 架构演进 │
│ • SVM、决策树 • 优化器选择 • 迁移学习 │
│ • XGBoost、LightGBM • 正则化技术 • 数据增强 │
│ │
└─────────────────────────────────────────────────────────────────┘🚀 进阶路线 (6-10 周)
适合有基础的学习者,掌握前沿技术。
┌─────────────────────────────────────────────────────────────────┐
│ │
│ 04 序列模型 ──────► 05 高级专题 ──────► 06 生成模型 │
│ (3-4周) (2-3周) (3-4周) │
│ │ │
│ ▼ │
│ 07 强化学习 │
│ (3-4周) │
│ │
│ 学习内容: │
│ • Transformer 架构 • 超参数优化 • VAE/GAN │
│ • BERT/GPT 原理 • 模型部署 • Diffusion │
│ • 注意力机制 • 分布式训练 • DQN/PPO │
│ │
└─────────────────────────────────────────────────────────────────┘🏆 实战路线 (持续)
适合准备参加竞赛或工业落地的学习者。
┌─────────────────────────────────────────────────────────────────┐
│ │
│ 09 实战项目 │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ ML 基础 │ │ CV 项目 │ │ NLP 项目 │ │
│ │ 项目 │ │ │ │ │ │
│ │ • Titanic │ │ • MNIST │ │ • 情感分析 │ │
│ │ • Otto │ │ • CIFAR │ │ • NER │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ ┌─────────────────────────────────────────────────┐ │
│ │ Kaggle 竞赛方案 │ │
│ │ 🥇 Feedback Prize - ELL (Top 1%) │ │
│ │ 🥇 RSNA Abdominal Trauma (Top 1%) │ │
│ │ 🥈 American Express Default (Top 5%) │ │
│ │ 🥉 RSNA Lumbar Spine (Top 10%) │ │
│ └─────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘各模块详情
📚 01 - 机器学习基础
建立坚实的机器学习理论基础。
| 子模块 | 核心算法 | 关键概念 |
|---|---|---|
| 线性模型 | OLS, Ridge, Lasso | 正则化, 偏差-方差权衡 |
| 分类算法 | Logistic, SVM | 最大间隔, 核技巧 |
| 树模型 | CART, RF, GBDT | 信息增益, 集成学习 |
| 降维聚类 | PCA, t-SNE, K-Means | 流形学习, 无监督学习 |
核心公式:
🧠 02 - 神经网络
掌握深度学习核心技术。
| 子模块 | 技术要点 | 应用场景 |
|---|---|---|
| 网络基础 | 前向传播, 反向传播 | 所有深度学习任务 |
| 优化技术 | SGD, Adam, AdamW | 模型训练加速 |
| 正则化 | Dropout, BatchNorm | 防止过拟合 |
| 自定义 | 自定义层, 损失函数 | 特殊任务需求 |
👁️ 03 - 计算机视觉
系统学习 CNN 架构演进。
架构演进时间线:
1998 2012 2014 2015 2019 2020
│ │ │ │ │ │
▼ ▼ ▼ ▼ ▼ ▼
LeNet ──► AlexNet ──► VGG/GoogLeNet ──► ResNet ──► EfficientNet ──► ViT| 技术 | 代表模型 | 创新点 |
|---|---|---|
| 基础 CNN | LeNet, AlexNet | 卷积, 池化 |
| 深度网络 | VGG, ResNet | 残差连接 |
| 高效网络 | MobileNet, EfficientNet | 深度可分离卷积 |
| Vision Transformer | ViT, Swin | 自注意力机制 |
📝 04 - 序列模型
从 RNN 到 Transformer 的演进。
Attention 核心公式:
| 模型 | 特点 | 适用场景 |
|---|---|---|
| RNN/LSTM | 序列建模, 门控机制 | 短序列任务 |
| Transformer | 并行计算, 长距离依赖 | NLP, CV |
| BERT | 双向编码, 预训练 | 文本理解 |
| GPT | 自回归, 生成 | 文本生成 |
⚡ 05 - 高级专题
工程化与优化技术。
| 专题 | 工具/方法 | 应用 |
|---|---|---|
| 超参优化 | Optuna, Ray Tune | 自动调参 |
| 分布式训练 | DDP, FSDP | 大规模训练 |
| 模型压缩 | 量化, 剪枝, 蒸馏 | 边缘部署 |
| 部署推理 | ONNX, TensorRT | 生产环境 |
🎨 06 - 生成模型
学习生成式 AI 核心技术。
| 模型 | 原理 | 应用 |
|---|---|---|
| VAE | 变分推断, 重参数化 | 图像生成, 表示学习 |
| GAN | 对抗训练, 博弈论 | 图像生成, 超分辨率 |
| Diffusion | 去噪扩散, 分数匹配 | DALL-E, Stable Diffusion |
🎮 07 - 强化学习
掌握决策与控制算法。
Bellman 方程:
| 方法 | 代表算法 | 特点 |
|---|---|---|
| 值方法 | DQN, Double DQN | 离散动作空间 |
| 策略方法 | REINFORCE, PPO | 连续动作空间 |
| Actor-Critic | A2C, SAC | 结合两者优点 |
技术栈总览
机器学习框架
| 框架 | 版本 | 用途 |
|---|---|---|
| Scikit-learn | 1.3+ | 传统 ML 算法 |
| XGBoost | 2.0+ | 梯度提升 |
| LightGBM | 4.0+ | 高效 GBDT |
深度学习框架
| 框架 | 版本 | 用途 |
|---|---|---|
| TensorFlow | 2.13+ | 生产部署 |
| PyTorch | 2.x | 研究开发 |
| Keras | 3.x | 快速原型 |
| Transformers | 4.30+ | NLP 预训练模型 |
数据处理
| 工具 | 用途 |
|---|---|
| NumPy / Pandas | 数值计算, 数据处理 |
| OpenCV / Pillow | 图像处理 |
| NLTK / spaCy | 文本处理 |
开始学习
建议
- 按照推荐路径循序渐进
- 每个模块都要动手实践
- 遇到问题先查阅理论笔记 (08)
- 学完基础后尽早开始实战项目 (09)
选择你的起点:
- 🆕 零基础 → 01 - 机器学习基础
- 📈 有 ML 基础 → 02 - 神经网络
- 🎯 想做项目 → 09 - 实战项目