Deep learning Wikipedia fast.ai Practical Deep Learning DeepLearning.AI Courses PyTorch Tutorials

DL / 深度学习

Q: 先用一句话抓住它

深度学习是使用多层神经网络，让模型从大量数据中自动学习特征和复杂规律的一类机器学习方法。 它最擅长的，正是那些人能感知、但很难用规则完整描述的东西：图片、语音、语言和视频。 换成生活里的说法，深度学习有点像一群分工很细的观察员接力看东西。第一个人只看颜色和边缘，第二个人把边缘拼成形状，第三个人再判断这些形状像什么。每一层都不需要一下子看懂全局，但层层传下去，系统就能从杂乱信息里看出更完整的意思。

AI百科编辑部2025-01-201.1万

DL 是 Deep Learning 的缩写，中文叫“深度学习”。它是机器学习的一类方法，核心特征是使用多层神经网络从数据中学习复杂模式

深度学习神经网络DL模型

DL 是 Deep Learning 的缩写，中文叫“深度学习”。它是机器学习的一类方法，核心特征是使用多层神经网络从数据中学习复杂模式。

“深”不是说它神秘，而是说网络有很多层。每一层都会对上一层的信息做进一步加工，逐渐从低级特征过渡到更抽象的理解。看图片时，底层可能识别边缘和颜色，中间层组合成纹理和局部形状，高层才判断这是一只猫、一辆车或一个人脸。

先用一句话抓住它

深度学习是使用多层神经网络，让模型从大量数据中自动学习特征和复杂规律的一类机器学习方法。

它最擅长的，正是那些人能感知、但很难用规则完整描述的东西：图片、语音、语言和视频。

换成生活里的说法，深度学习有点像一群分工很细的观察员接力看东西。第一个人只看颜色和边缘，第二个人把边缘拼成形状，第三个人再判断这些形状像什么。每一层都不需要一下子看懂全局，但层层传下去，系统就能从杂乱信息里看出更完整的意思。

为什么需要“深”

传统机器学习往往需要人先设计特征。比如做图片识别时，人可能要告诉系统边缘、颜色、纹理、形状这些特征怎么提取。深度学习的变化在于，它更强调表示学习，也就是让模型自己从原始数据里学出有用表示。

flowchart LR
    Input["输入层"] --> H1["低级特征<br/>边缘、音素、词片段"]
    H1 --> H2["组合特征<br/>纹理、短语、局部结构"]
    H2 --> H3["高级语义<br/>对象、意图、上下文"]
    H3 --> Output["输出<br/>分类、预测、生成"]

神经网络里有很多可调整的参数。训练时，模型会根据预测错误不断调整这些参数，这个过程常通过反向传播完成。因为计算量很大，深度学习的发展也离不开 GPU 和其他加速硬件。

和机器学习、大模型的关系

深度学习不是 AI 的全部，而是机器学习中的一条强力路线。它通常需要更多数据和算力，但在复杂数据上表现突出。图像识别、语音识别、机器翻译、大语言模型、图像生成模型，都和深度学习密切相关。

今天我们熟悉的大模型，通常也是深度学习模型。大语言模型常使用 Transformer 架构，图像模型可能使用扩散模型、卷积网络或其他结构。普通读者不必一开始背这些结构名，只要先理解：深度学习让模型可以在多层结构中逐步提取特征，因此能处理更复杂的输入。

它带来的能力

深度学习让图像识别、语音识别、自然语言处理和生成式 AI 都有了明显进步。它可以帮助系统识别医学影像中的可疑区域，把语音转成文字，把一段话翻译成另一种语言，根据文字生成图片，也可以在科研中辅助药物发现、材料研究和天气预测。

但深度学习并不总是最佳选择。小数据、强规则、可解释性要求很高的任务，有时用更简单的方法反而更稳。模型越大，训练和部署成本通常越高，解释结果也更困难。

容易误解的地方

很多人听到“神经网络”，会以为它真的像人脑一样理解世界。更准确地说，它是一种受大脑启发的计算结构，擅长从数据中学习模式，但不等于拥有人的理解和常识。

另一个误区是认为层数越多越好。模型结构、数据质量、训练方法、任务目标都同样重要。一个很深的模型如果数据有偏、目标不清或评估不严，也会得到糟糕结果。

怎么判断它该不该用

深度学习的优势来自数据和规模，也带来成本和风险。使用它时要关注数据来源、隐私、偏见、评估指标和失败案例。越是涉及医疗、金融、安全和公共决策，越不能只看模型分数，还要有人工审查、可追溯机制和清楚的责任边界。