如何理解 RNN ?LSTM 又是啥?
✦ AI 摘要
用通俗类比解释了 RNN 的工作原理及其梯度消失问题,并通过数学公式详细说明 LSTM 的门控机制如何实现长期记忆。
用通俗类比解释了 RNN 的工作原理及其梯度消失问题,并通过数学公式详细说明 LSTM 的门控机制如何实现长期记忆。
用猜糖果颜色的直观类比解释交叉熵的概念,配以公式推导和逐步数值计算示例,阐明其作为深度学习分类任务损失函数的核心作用。
用学生姓名分配特征的类比,生动解释嵌入层如何将离散数据转换为有语义含义的数值向量,并结合 NLP 词嵌入实例深化理解。
Andrej Karpathy《Zero to Hero》系列第二讲的学习笔记,记录了从二元字符模型到神经网络语言模型的构建过程,深入理解字符级序列生成的核心思路。
Andrej Karpathy《Zero to Hero》系列第一讲的学习笔记,通过从零构建 Micrograd,深入理解反向传播算法与自动微分的本质原理。