Skip to content

入门基础

简介

这是一个面向零基础同学的人工智能(AI)与深度学习入门学习路线,适用于没有数学基础、没有编程经验或只是听说过 AI 的同学。

AI 涉及数学、编程、机器学习理论以及深度学习框架,但每个部分都有大量优质的免费学习资源。与其“为了学习而学习”,不如掌握基础后边做项目边查资料,在实践中逐步补齐知识。

  • 难度:⭐⭐⭐

  • 先修基础:无

学习路径

数学基础

线性代数

学习目标:掌握矩阵运算、向量空间、特征值等概念——理解神经网络计算的核心基础。

教程:

资源说明:

网络资源极其丰富,可根据自身情况在 B 站搜索相关课程(如 3Blue1Brown、MIT 线代,宋浩线性代数),书籍也很多,此处不再赘述。


微积分

学习目标:掌握导数、梯度、链式法则等内容——反向传播算法的数学核心。

教程:

资源说明:高等数学与数学分析课程会详细讲解,可自行在 B 站搜索课程学习,如陈纪修《数学分析》

推荐读物:

  • 《普林斯顿微积分读本》

概率论与数理统计

学习目标:掌握概率分布、贝叶斯定理、最大似然估计等——理解模型输出与不确定性建模的关键。

教程:

推荐教材:

  • 《概率论与数理统计教程》(茆诗松)

编程基础

Python

学习目标:能够熟练使用 Python —— AI 行业的通用工作语言。

教程:

推荐书目:

  • 《Python编程从入门到实践》(蟒蛇书)

科学计算库

学习目标:掌握基础数据结构和科学计算能力,为后续机器学习做准备。

  • NumPy:数组运算、矩阵计算

  • Pandas:数据分析、数据清洗(准备数据集必备技能)

教程:


机器学习与 AI 理论

前置基础:Python 与数学基础

经典机器学习

学习目标:掌握基本模型与核心概念,包括训练集/测试集、过拟合、损失函数、学习率等。

教程:


深度学习框架与核心模型

主流深度学习框架

学习目标:掌握 PyTorch 或 TensorFlow,从张量操作开始,到搭建与训练神经网络。

  • PyTorch(推荐):科研主流

  • TensorFlow:工业常见

教程:


跑通经典模型

  • CNN:在 CIFAR-10 上实现图像分类

  • RNN/LSTM:处理文本生成或时间序列预测

推荐课程:

  • B 站「跟李沐学 AI」系列

进阶

深入理解现代模型架构

Transformer

必须深入掌握:

  • 自注意力机制

  • 前馈网络

  • 残差连接

这是一切大模型(LLM、扩散模型、Vision Transformer 等)的基础。

推荐:

  • 论文《Attention Is All You Need》

  • 邱锡鹏《神经网络与深度学习》

  • 《大规模语言模型》(黄萱菁推荐参考书)


系统与性能优化

操作系统基础

帮助分析训练中的性能瓶颈(CPU、内存、I/O)。

推荐课程:

  • 南京大学蒋炎岩《操作系统》

并行与分布式训练

学习 torchrun、DeepSpeed、ZeRO 等工具,理解:

  • 数据并行

  • 模型并行

  • 多卡训练

  • 多机通信


计算机网络

理解分布式训练中的通信机制(如 All-Reduce)。

推荐课程:

  • 中科大《计算机网络》

其他补充

以上内容构成 AI 的基础学习路线。进入课题组后主要根据导师方向深入。除此之外,建议:

  • 紧跟社区:关注 X(Twitter)、知乎、小红书上的顶级研究者和机构

  • 阅读并复现论文:从经典小模型开始

  • 加入项目:形成“问题驱动”的学习循环(实验室 / Kaggle / 开源项目)

  • 掌握 Hugging Face:使用 Trainer API 微调预训练模型

  • 培养核心软技能

    • 阅读官方文档
    • 熟悉 GitHub
    • 善用大模型(如 ChatGPT)做学习助手

下一步去哪?

  • 自然语言处理(NLP) —— 了解文本建模和 LLM 的核心

  • 计算机视觉(CV) —— 深入 CNN、ViT 等架构

  • 大模型微调 —— LoRA、QLoRA、指令微调

  • AI 工程化 —— 部署、优化、服务化

  • 参与开源项目 —— GitHub、Hugging Face Hub