多层感知机
Published:
本文详细介绍了从感知机到多层感知机(MLP)的演变历程,分析了 XOR 问题对 AI 发展的影响及非线性激活函数的重要性。文章深入讲解了 MLP 的结构、常用激活函数(Sigmoid、Tanh、ReLU)及基于 PyTorch 的代码实现,并探讨了参数初始化、深层网络优势及“维度灾难”等核心问题。
Published:
本文详细介绍了从感知机到多层感知机(MLP)的演变历程,分析了 XOR 问题对 AI 发展的影响及非线性激活函数的重要性。文章深入讲解了 MLP 的结构、常用激活函数(Sigmoid、Tanh、ReLU)及基于 PyTorch 的代码实现,并探讨了参数初始化、深层网络优势及“维度灾难”等核心问题。
Published:
本文深入探讨了线性回归模型的基本原理,将其等价为单层神经网络进行解析。详细介绍了损失函数、代价函数、解析解及梯度下降优化算法的数学原理,并分别展示了基于 PyTorch 的从零代码实现与利用框架组件的简洁实现,为理解深度学习模型的训练过程奠定基础。
Published:
本文深入探讨了深度学习中自动求导的核心机制。首先讲解了向量与矩阵求导的链式法则及具体推导示例;接着详细解析了计算图(Computational Graph)的原理、正反向传播的计算与内存复杂度;最后介绍了基于 PyTorch 的自动微分代码实现与常用操作,为理解深度学习框架的底层运算逻辑奠定基础。
Published:
本文深入探讨了矩阵求导在深度学习中的意义,详细介绍了标量、向量、矩阵之间相互求导的规则和形状变化,并总结了分子布局下的求导公式,为理解反向传播算法奠定数学基础。
Published:
本文总结了深度学习中常用的线性代数基础知识,包括向量点乘、范数、矩阵乘法、特征值分解等基本运算,并提供了对应的 PyTorch 代码实现,最后解答了关于 Tensor 数据类型转换的常见问题。
Published:
本文介绍了深度学习中 N 维数组的概念,以及使用 PyTorch 和 Pandas 进行数据操作和预处理的基本方法,包括张量的创建、运算、广播机制以及 CSV 文件的读取和缺失值处理。
Published:
本文介绍了 Git 的安装与 VSCode 集成配置,讲解了 Git 的基本语法,并详细说明了如何使用 Github 进行多人在线协同,包括贡献者协同(Pull Requests)和核心开发组内协同的流程。
Published:
本文介绍了如何配置 VSCode 以优化 Markdown 编写体验,包括推荐安装的扩展插件如 Markdown All In One、Markdown Emoji 等,以及如何利用这些工具提升文档编写效率。