【知识】深度学习相关概念笔记
深度学习
机器学习的子领域,通过构建和训练人工神经网络(尤其是深层神经网络)来进行复杂的模式识别和预测任务。深度学习模型能够从大量的数据中自动提取特征,并通过多层次的非线性变换进行复杂的决策和预测。
深度学习的核心概念
神经网络:
基础概念: 深度学习模型的基础是人工神经网络,这些网络由多个层次的“神经元”组成。每个神经元通过加权连接和激活函数进行计算。
结构: 神经网络的基本结构包括输入层、隐藏层和输出层。深度学习中的“深度”指的是网络中隐藏层的数量。
多层结构(Deep Neural Networks, DNNs)
层次: 深度学习模型具有多个隐藏层(而不仅仅是输入和输出层),这些层次使得模型能够学习和表示复杂的特征和模式。
非线性变换: 每个隐藏层通过非线性激活函数(如 ReLU、Sigmoid、Tanh)将输入数据进行变换,使得模型能够学习非线性关系。
特征学习
自动特征提取: 深度学习模型能够自动从原始数据中提取有用的特征,而不需要手动设计特征。这种特征学习能力使得深度学习在处理复杂数据(如图像、文本)时特别强大。
训练过程
前向传播: 输入数据经过网络的每一层进行计算,最终生成预测结果。
损失函数: 损失函数衡量模型预测结果与实际结果之间的误差。
反向传播: 通过计算梯度(使用链式法则),模型调整网络中的权重以最小化损失函数,从而优化模型参数。
优化算法: 如梯度下降(Gradient Descent)、Adam、RMSprop 等,用于更新网络权重。
大规模数据和计算
数据需求: 深度学习模型通常需要大量标注数据来进行有效训练。
计算资源: 训练深度学习模型通常需要强大的计算资源,尤其是 GPU 或 TPU,以加速训练过程。
常见的深度学习模型
卷积神经网络(CNNs)
用途: 主要用于计算机视觉任务,如图像分类、目标检测、图像分割。
特点: 通过卷积层自动提取图像特征,具有局部连接和权重共享的特性。
循环神经网络(RNNs)
用途: 主要用于处理序列数据,如自然语言处理(NLP)中的文本生成、机器翻译、语音识别。
特点: 能够处理序列数据中的时间依赖性,通过隐藏状态将信息传递到序列中的后续时间步。
长短期记忆网络(LSTMs)
用途: 一种改进的 RNN 结构,主要用于长期依赖问题。
特点: 通过引入门控机制(输入门、遗忘门、输出门)解决传统 RNN 在处理长序列时的梯度消失问题。
生成对抗网络(GANs)
用途: 用于生成新的数据样本,如图像生成、数据增强。
特点: 由生成器和判别器两个网络组成,生成器生成数据样本,判别器评估样本的真实性,二者通过对抗训练进行优化。
变分自编码器(VAEs)
用途: 用于生成数据和数据表示学习。
特点: 通过编码器将数据压缩成潜在空间(latent space)表示,并通过解码器重构数据。
应用领域
计算机视觉: 图像分类、目标检测、图像分割、图像生成等。
自然语言处理(NLP): 机器翻译、文本生成、情感分析、问答系统等。
语音处理: 语音识别、语音合成、语音转文字等。
推荐系统: 个性化推荐、广告推荐等。
医疗健康: 医学图像分析、疾病预测、药物发现等。